WO2018074825A1 - 영상 부호화 또는 복호화를 위한 장치 및 방법 - Google Patents

영상 부호화 또는 복호화를 위한 장치 및 방법 Download PDF

Info

Publication number
WO2018074825A1
WO2018074825A1 PCT/KR2017/011484 KR2017011484W WO2018074825A1 WO 2018074825 A1 WO2018074825 A1 WO 2018074825A1 KR 2017011484 W KR2017011484 W KR 2017011484W WO 2018074825 A1 WO2018074825 A1 WO 2018074825A1
Authority
WO
WIPO (PCT)
Prior art keywords
resolution
motion vector
vector resolution
current block
current
Prior art date
Application number
PCT/KR2017/011484
Other languages
English (en)
French (fr)
Inventor
임정연
이선영
손세훈
신재섭
김형덕
이경택
Original Assignee
에스케이텔레콤 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020170025673A external-priority patent/KR20180043151A/ko
Application filed by 에스케이텔레콤 주식회사 filed Critical 에스케이텔레콤 주식회사
Priority to CN202310713793.0A priority Critical patent/CN116567209A/zh
Priority to US16/343,164 priority patent/US10924757B2/en
Priority to CN202310713813.4A priority patent/CN116567211A/zh
Priority to CN202310710814.3A priority patent/CN116567208A/zh
Priority to CN201780064071.XA priority patent/CN109845258B/zh
Priority to CN202310713804.5A priority patent/CN116567210A/zh
Publication of WO2018074825A1 publication Critical patent/WO2018074825A1/ko
Priority to US17/141,691 priority patent/US11962798B2/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Definitions

  • the present invention relates to image encoding or decoding for efficiently encoding an image.
  • moving picture data has a larger amount of data than audio data, still image data, and the like, a large amount of hardware resources including a memory are required to store or transmit itself without processing for compression. Accordingly, when storing or transmitting video data, the video data is compressed and stored or transmitted using an encoder, and the decoder receives the compressed video data, decompresses, and plays the video data.
  • video compression techniques include H.264 / AVC and High Efficiency Video Coding (HEVC), which was established in early 2013, which improved coding efficiency by about 40%.
  • inter prediction encoding which is one of prediction methods for encoding or decoding
  • information on encoding a residual block generated after predicting a current block and motion information used to predict the current block are transmitted to a decoding apparatus.
  • the motion information includes information on a reference picture and a motion vector used to predict the current block, and in the case of the existing HEVC standard, the motion vector is expressed in units of 1 / 4-pixel.
  • the present invention provides an image encoding or decoding technique for efficiently encoding an image by adjusting a resolution for obtaining a motion vector according to characteristics of an image according to a change in an image and a block size.
  • An aspect of the present invention provides a method of encoding an image, comprising: determining a motion vector resolution of a current block; Determining a motion vector of the current block according to the motion vector resolution of the current block; Predicting and encoding the current block using the motion vector of the current block; And encoding information on the motion vector resolution of the current block.
  • information about a motion vector resolution of the current block is extracted from a bitstream and the motion of the current block. Determining a motion vector resolution of the current block based on information on a vector resolution; And predicting and decoding the current block using the motion vector of the current block determined according to the motion vector resolution of the current block.
  • Another aspect of the present invention is an apparatus for adaptively determining a motion vector resolution of a current block and decoding the current block, wherein information about the motion vector resolution of the current block is extracted from a bitstream and A motion vector resolution decoder that determines a motion vector resolution of the current block based on the information about the motion vector resolution; And an image decoder which predicts and decodes the current block by using the motion vector of the current block determined according to the resolution of the motion vector of the current block.
  • FIG. 1 is a block diagram of a general video encoding apparatus
  • 3 is an exemplary diagram of neighboring blocks of a current block
  • FIG. 4 is a block diagram of an image encoding apparatus according to an embodiment of the present invention.
  • FIG. 5 is an exemplary diagram for describing a process of interpolating a reference picture and a resolution of the reference picture
  • FIG. 6 is a diagram for comparing the degree of movement between screens between two frames
  • FIG. 7 illustrates a resolution determiner 410 according to an embodiment
  • FIG. 8 is a diagram illustrating a resolution encoder 430 in the case of encoding motion vector resolution information of a current CU using a resolution difference value
  • FIG. 9 is a diagram illustrating a resolution encoder 430 representing a motion vector of a current CU as a resolution ratio factor instead of a resolution difference value.
  • FIG. 10 is a block diagram schematically illustrating a general video decoding apparatus
  • FIG. 11 is a diagram illustrating an image decoding apparatus 1100 according to an embodiment of the present invention.
  • FIG. 12 is a flowchart illustrating a method of decoding an image in the image decoding apparatus 1100 according to the first embodiment of the present invention
  • FIG. 13 is a diagram illustrating an example of adaptively determining a resolution
  • FIG. 14 is a flowchart illustrating a case in which some steps are added in the flowchart of FIG. 12;
  • 15 is a flowchart illustrating a method of decoding an image in the image decoding apparatus 1100 according to the second embodiment of the present invention.
  • 16 is a diagram illustrating another example of adaptively determining a resolution
  • FIG. 17 is a flowchart illustrating a case in which some steps are added to the flowchart of FIG. 15;
  • FIG. 18 is a flowchart illustrating a method of decoding an image in the image decoding apparatus 1100 according to the third embodiment of the present invention.
  • FIG. 19 is a flowchart illustrating a case in which some steps are added to the flowchart of FIG. 18.
  • FIG. 1 is a block diagram schematically illustrating a general video encoding apparatus.
  • the image encoding apparatus 100 may include a block divider 110, a predictor 120, a subtractor 130, a transformer 140, a quantizer 145, an encoder 150, an inverse quantizer 160, An inverse transform unit 165, an adder 170, a filter unit 180, and a memory 190 are included.
  • Each component of the image encoding apparatus 100 may be implemented by a hardware chip, or may be implemented by software and one or more microprocessors to execute a function of software corresponding to each component.
  • the block dividing unit 110 After dividing each picture constituting an image into a plurality of coding tree units (CTUs), the block dividing unit 110 recursively divides the CTUs using a tree structure.
  • a leaf node in the tree structure becomes a CU (coding unit) which is a basic unit of coding.
  • a tree structure a quadtree (QT) structure in which a parent node is divided into four subnodes is used, or a mixed binary tree (BinaryTree, BT) structure in which a QT structure and a parent node is divided into two subnodes is used.
  • QTBT QuadTree plus BinaryTree
  • the CTU is first divided into a QT structure.
  • the leaf nodes of the QT may then be further partitioned by BT.
  • the partition information generated by the block division unit 110 by dividing the CTU by the QTBT structure is encoded by the encoding unit 150 and transmitted to the decoding apparatus.
  • a first flag (QT split flag, QT_split_flag) indicating whether a block of a corresponding node is split is encoded. If the first flag is 1, the block of the node is divided into four blocks of the same size. If the first flag is 1, the node is no longer divided by the QT.
  • a second flag (BT split flag, BT_split_flag) indicating whether a block of the corresponding node is split is encoded.
  • BT there may be a plurality of partition types. For example, there may be two types of partitioning a block of a node horizontally into two blocks of the same size and a type of partitioning vertically. Alternatively, there may further be a type in which blocks of the corresponding node are further divided into two blocks having an asymmetric shape. The asymmetrical form may include dividing a block of a node into two rectangular blocks having a size ratio of 1: 3, or dividing a block of the node in a diagonal direction.
  • partition type information indicating a partition type of the corresponding block is further encoded.
  • FIG. 2 is an exemplary diagram of block division using a QTBT structure.
  • a of FIG. 2 is an example in which a block is divided by a QTBT structure, and (b) shows it in a tree structure.
  • the solid line indicates the division by the QT structure
  • the dotted line indicates the division by the BT structure.
  • the parenthesis indicates a layer of QT
  • the parenthesis indicates a layer of BT.
  • a number represents partition type information.
  • the block corresponding to the first node of layer 1 of the QT proceeds to BT.
  • the following information may be further encoded.
  • the information is encoded as header information of an image, for example, may be encoded by a sequence parameter set (SPS) or a picture parameter set (PPS).
  • SPS sequence parameter set
  • PPS picture parameter set
  • CTU size the top layer of QTBT, that is, the block size of the root node
  • MinQTSize the minimum block size of leaf nodes allowed in QT
  • MaxBTSize the maximum block size of the root node allowed by BT
  • MaxBTDepth the maximum depth allowed by BT
  • MinBTSize the minimum block size of leaf nodes allowed in BT
  • a block having the same size as MinBTSize in BT is no longer split and no split information (second flag, split type information) regarding BT is also encoded.
  • second flag, split type information the maximum or minimum block size that a loop or leaf node of the QT and BT can have at a high level such as a sequence parameter set (SPS) or a picture parameter set (PPS) can be defined to determine whether the CTU is divided or not.
  • SPS sequence parameter set
  • PPS picture parameter set
  • the amount of coding for the information indicating the partition type can be reduced.
  • the luma component and the chroma component of the CTU may be divided into the same QTBT structure.
  • the present invention is not limited thereto, and the luminance component and the chrominance component may be divided using separate QTBT structures, respectively.
  • a luma component and a chroma component may be divided into different QTBT structures.
  • a block corresponding to a CU to be encoded or decoded is called a 'current block'.
  • the prediction unit 120 predicts the current block and generates a prediction block.
  • the predictor 120 includes an intra predictor 122 and an inter predictor 124.
  • the intra predictor 122 predicts pixels in the current block by using pixels (reference pixels) positioned around the current block in the current picture including the current block.
  • pixels reference pixels
  • the inter prediction unit 124 searches a block most similar to the current block in the reference picture encoded and decoded before the current picture, and generates a prediction block for the current block using the searched block. A motion vector corresponding to a displacement between the current block in the current picture and the prediction block in the reference picture is generated.
  • the motion information including the information on the reference picture and the motion vector used to predict the current block is encoded by the encoder 150 and transmitted to mv_resolution_scale.
  • the motion information of the current block can be transmitted to the decoding apparatus by encoding information for identifying the neighboring block. This method is called 'merge mode'.
  • the inter prediction unit 124 selects a predetermined number of merge candidate blocks (hereinafter, referred to as 'merge candidates') from neighboring blocks of the current block.
  • All or part of the upper left block AL may be used.
  • a block located within a reference picture (which may be the same as or different from the reference picture used to predict the current block) other than the current picture in which the current block is located may be used as the merge candidate.
  • a co-located block or a block adjacent to a block in the same position as the current block in the reference picture may be further used as a merge candidate.
  • the inter prediction unit 124 constructs a merge list including a predetermined number of merge candidates using these neighboring blocks.
  • the merge candidate to be used as the motion information of the current block is selected from the merge candidates included in the merge list, and merge index information for identifying the selected candidate is generated.
  • the generated merge index information is encoded by the encoder 150 and transmitted to the decoding apparatus.
  • Another way to encode motion information is to encode differential motion vectors.
  • the inter prediction unit 124 derives the predicted motion vector candidates for the motion vector of the current block by using the neighboring blocks of the current block.
  • a neighboring block used to derive the predictive motion vector candidates a left block L, an upper block A, a right upper block AR, and a lower left block adjacent to the current block in the current picture shown in FIG. BL
  • all or part of the upper left block AL may be used.
  • a block located within a reference picture (which may be the same as or different from the reference picture used to predict the current block) that is not the current picture in which the current block is located may be used as a neighboring block used to derive predictive motion vector candidates. It may be.
  • a co-located block or a block adjacent to a block at the same position as the current block in the reference picture may be used.
  • the inter prediction unit 124 derives the predictive motion vector candidates using the motion vectors of the neighboring blocks, and determines the predictive motion vector for the motion vector of the current block using the predictive motion vector candidates.
  • the difference motion vector is calculated by subtracting the predicted motion vector from the motion vector of the current block.
  • the predicted motion vector may be obtained by applying a predefined function (eg, median value, average value calculation, etc.) to the predicted motion vector candidates.
  • a predefined function eg, median value, average value calculation, etc.
  • the image decoding apparatus also knows a predefined function.
  • the image decoding apparatus since the neighboring block used to derive the predictive motion vector candidate has already been encoded and decoded, the image decoding apparatus is already known as the motion vector of the neighboring block. Therefore, the image encoding apparatus 100 does not need to encode information for identifying a predicted motion vector candidate. Therefore, in this case, the information on the differential motion vector and the reference picture used to predict the current block are encoded.
  • the predicted motion vector may be determined by selecting any one of the predicted motion vector candidates.
  • the information for identifying the selected predicted motion vector candidate is further encoded along with the information about the differential motion vector and the reference picture used for predicting the current block.
  • the subtractor 130 subtracts the prediction block generated by the intra predictor 122 or the inter predictor 124 from the current block to generate a residual block.
  • the converter 140 converts the residual signal in the residual block having pixel values of the spatial domain into a transform coefficient of the frequency domain.
  • the transform unit 140 may convert the residual signals in the residual block using the size of the current block as a conversion unit, or divide the residual block into a plurality of smaller subblocks and convert the residual signals in a subblock-sized transform unit. You can also convert. There may be various ways of dividing the residual block into smaller subblocks. For example, it may be divided into sub-blocks of a predetermined same size, or a quadtree (QT) scheme may be used in which the residual block is a root node.
  • QT quadtree
  • the quantization unit 145 quantizes the transform coefficients output from the transform unit 140, and outputs the quantized transform coefficients to the encoder 150.
  • the encoder 150 generates a bitstream by encoding the quantized transform coefficients by using an encoding method such as CABAC.
  • the encoder 150 encodes information such as CTU size, MinQTSize, MaxBTSize, MaxBTDepth, MinBTSize, QT split flag, BT split flag, split type, etc. related to block division, so that the decoding apparatus encodes a block in the same way as the encoding apparatus Allow splitting.
  • the encoder 150 encodes information on a prediction type indicating whether the current block is encoded by intra prediction or inter prediction, and encodes intra prediction information or inter prediction information according to the prediction type.
  • the encoder 150 encodes a syntax element for the inter prediction information.
  • the syntax element for inter prediction information includes the following.
  • Mode information indicating whether motion information of the current block is encoded in a merge mode or a mode of encoding a differential motion vector.
  • the encoding unit 150 uses merge index information indicating the candidate of the merge candidates as a candidate for extracting the motion information of the current block as a syntax element for the motion information.
  • the motion information when the motion information is encoded by the mode for encoding the differential motion vector, the information about the differential motion vector and the information about the reference picture are encoded as syntax elements for the motion information. If the predicted motion vector is determined in such a manner as to select any one of the plurality of predicted motion vector candidates, the syntax element for the motion information further includes predicted motion vector identification information for identifying the selected candidate. Include.
  • the inverse quantizer 160 inversely quantizes the quantized transform coefficients output from the quantizer 145 to generate transform coefficients.
  • the inverse transformer 165 restores the residual block by converting the transform coefficients output from the inverse quantizer 160 from the frequency domain to the spatial domain.
  • the adder 170 reconstructs the current block by adding the reconstructed residual block and the predicted block generated by the predictor 120.
  • the pixels in the reconstructed current block are used as reference pixels when intra prediction of the next order of blocks.
  • the filter unit 180 deblocks and filters the boundary between reconstructed blocks in order to remove blocking artifacts that occur due to encoding / decoding of blocks. When all the blocks in a picture are reconstructed, the reconstructed picture is used as a reference picture for inter prediction of a block in a picture to be encoded later.
  • the apparatus for encoding an image may encode the current block using a skip mode.
  • the skip mode only motion information of the current block is encoded and no other information about the current block, such as information on the residual block, is encoded.
  • the merge index information described above may be used as the motion information of the current block.
  • the image decoding apparatus sets the motion information of the merge candidate indicated by the merge index information decoded from the bitstream as the motion information of the current block.
  • the prediction block predicted by the motion information of the current block is reconstructed as the current block.
  • the skip mode is distinguished from the merge mode that encodes information on the residual block in addition to the motion information of the current block in that no information other than the motion information of the current block is encoded.
  • the method of encoding motion information of the current block is the same in the skip mode and the merge mode, all the descriptions of the merge mode below may be equally applied to the skip mode.
  • FIG. 4 is a diagram illustrating an image encoding apparatus 400 according to an embodiment of the present invention.
  • the image encoding apparatus 400 includes a resolution determiner 410, an image encoder 420, and a resolution encoder 430.
  • the resolution determiner 410 determines the motion vector resolution for estimating the motion of the current CU.
  • the motion vector resolution is the minimum unit for determining the motion vector.
  • the motion vector resolution may mean the resolution of the reference picture for motion compensation of the current CU, that is, to which pixel to interpolate the reference picture. For example, if the motion vector resolution is 1/4 pixel, the reference picture is interpolated up to 1/4 pixel unit and the motion vector is measured up to 1/4 pixel unit.
  • the minimum unit for determining the motion vector is a fractional pixel unit such as 1/4 pixel, 1/2 pixel, or an integer pixel unit such as 1 pixel, 2 pixel, 3 pixel, or 4 pixel. Can be
  • the image encoder 420 estimates motion in block units (ie, CU units) according to the determined motion vector resolution, determines a motion vector of the CU, and predicts and encodes the CU using the determined motion vector.
  • the resolution encoder 430 encodes information about the motion vector resolution of the motion vector used to predict the CU.
  • the image encoder 420 may be implemented as the image encoding apparatus 100 described above with reference to FIG. 1.
  • the function of the resolution determiner 410 may be included in the function of the predictor 120 in the image encoding apparatus 100 and may be integrally implemented with the predictor 120.
  • the function of the resolution encoder 430 may be included in the function of the encoder 150 in the image encoding apparatus 100 and may be implemented integrally with the encoder 150.
  • FIG. 5 is an exemplary diagram for describing a process of interpolating a reference picture and performing motion estimation by the inter prediction unit 124 and a resolution of the reference picture.
  • FIG. 5 illustrates pixels of a reference picture stored in the memory 190 and pixels obtained by interpolating pixels of the reference picture to subpixels.
  • the previously restored integer pixels A1 to F6 of the reference picture are filtered by an interpolation filter, for example, subpixels a to s may be generated.
  • the resolution of the reference picture for motion estimation and motion compensation may be two times, four times, or more than the integer pixel resolution.
  • motion estimation is a process of finding a part most similar to the current CU in the interpolated reference picture and outputting a block of the corresponding part and a motion vector indicating the corresponding block, and the motion vector generated in this process is encoded by the encoder 150. Is encoded.
  • the motion vector is divided into fractional pixels (1 / 2-pixel, 1 / 4-pixel, 1 / 8-pixel, 1 / 6-pixel, etc.).
  • the motion vector may be expressed in one or more integer pixel units (1-pixel unit, 2-pixel unit, 3-pixel unit, 4-pixel unit, etc.).
  • FIG. 6 is a diagram for comparing the degree of movement between screens between two frames.
  • the motion corresponding to the circle in FIG. 6 has a fine movement between the two frames. Since the motion of the object is estimated and the object corresponding to the triangular motion is relatively large between two frames, the motion may be estimated in integer pixel units.
  • the motion information is not directly signaled, but an index value corresponding to the motion information candidate selected from the plurality of motion information candidates is signaled. Therefore, information on the motion vector resolution of the selected motion information candidate is not transmitted along with the index value.
  • the inter prediction mode of the CU to be encoded is a mode for encoding the differential motion vector
  • differential motion vector information since differential motion vector information is signaled, it is more effective to express differential motion vector information in fractional pixel units according to the magnitude of the differential motion vector. Either it may be or it may be more effective to express it in integer units.
  • FIG. 7 is a diagram illustrating a resolution determiner 410 according to an embodiment.
  • the resolution determiner 410 includes a resolution mode determiner 710, an alternative resolution determiner 720, and an adaptive resolution determiner 730. According to an exemplary embodiment, the resolution determiner 410 may be implemented in a form in which at least one component of the resolution mode determiner 710, the alternative resolution determiner 720, and the adaptive resolution determiner 730 is omitted.
  • the resolution mode determiner 710 determines whether to activate the adaptive motion vector resolution mode. For example, a plurality of CUs select whether to adaptively determine a motion vector resolution with respect to a higher level image unit included therein.
  • the higher level image unit may be an image sequence, a picture, a slice, a CTU, and the like. If it is selected not to adaptively determine the motion vector resolution of the higher level image unit (that is, not in the adaptive motion vector resolution mode), the default motion vector resolution is applied to all CUs in the higher level image unit. That is, a fixed default motion vector resolution such as 1/4 pixel is applied to all CUs in the higher level image unit.
  • the default motion vector resolution may be a predetermined specific motion vector resolution shared by the image encoding apparatus and the image decoding apparatus, or may be a value determined by the image encoding apparatus in the higher level image region and signaled to the image decoding apparatus.
  • the motion vector resolution is adaptively determined for each CU to be inter predicted by the alternative resolution determiner 720 and the adaptive resolution determiner 730 described later.
  • the alternative resolution determiner 720 determines an alternative resolution in addition to the default motion vector resolution.
  • the alternative resolution may be determined for each unit of any one of a sequence, a picture, a slice, a CTU, and a CU.
  • the alternative resolution may be determined for each image unit equal to the unit of the image to which the adaptive motion vector resolution mode is applied. For example, if the adaptive motion vector resolution mode is determined in units of SPS, the alternative resolution may be determined in units of SPS. If the adaptive motion vector resolution mode is determined in units of PPS or slice, the alternative resolution may be determined in units of PPS or slice.
  • the default motion vector resolution may be determined for each image unit (eg, slice, CTU, or CU) smaller than the unit of the image to be determined.
  • the alternative resolution may be determined by any one unit of PPS, slice, or CTU, which is a lower level image unit than the SPS.
  • the image unit may be determined by any one of a slice and a CTU.
  • the alternative resolution may be determined in units of CUs to be encoded.
  • the alternative resolution determiner 720 may select one of the plurality of motion vector resolution candidates as the alternative resolution in determining the alternative resolution.
  • the adaptive resolution determiner 730 determines the motion vector resolution of the current CU. For example, the adaptive resolution determiner 730 can determine either the default motion vector resolution or the alternate resolution as the motion vector resolution of the current CU.
  • the resolution encoder 430 generates and encodes information on the motion vector resolution based on the information determined by the resolution determiner 410.
  • a method of encoding the motion vector resolution information by the resolution encoder 430 when the motion vector resolution of the current CU is determined from the default motion vector resolution and the alternative resolution will be described as an example.
  • an image unit for selecting whether to adaptively determine a motion vector resolution between a default motion vector resolution and an alternate resolution and an image unit for determining an alternative resolution are the same, and each of the two image units is larger than a CU.
  • the embodiment illustrates a large case.
  • the resolution encoder 430 may apply the Adaptive_MV_resolution_enabled_flag () flag indicating whether to adaptively determine the motion vector resolution.
  • the first identification information is inserted into the Sequence Parameter Set (SPS).
  • the resolution encoder 430 is a flag indicating whether to adaptively determine the motion vector resolution, Adaptive_MV_resolution_enabled_flag To the PPS (Picture Parameter Set).
  • the resolution encoder 430 determines whether to determine the motion vector resolution adaptively. Inserts the flag indicating Adaptive_MV_resolution_enabled_flag into the slice (or CTU) header.
  • the resolution encoder 430 selects alternative_mv_resolution information as information for identifying the alternative resolution selected from the predefined plurality of motion vector resolution candidates. Generate and encode.
  • the resolution encoder 430 indicates that mv_resolution_flag indicates that the default motion vector resolution is to be used as the motion vector resolution of the current CU. (Ie, second identification information) is generated.
  • the resolution encoder 430 indicates that the alternative resolution is used as the motion vector resolution of the current CU.
  • Mv_resolution_flag is generated and information about mv_resolution_flag is encoded.
  • an image unit for selecting whether to adaptively determine a motion vector resolution between a default motion vector resolution and an alternative resolution is a higher level image unit of the image unit for determining an alternative resolution, and determines an alternative resolution.
  • the image unit is an embodiment illustrating the case of a high level image unit of a CU.
  • an image unit for selecting whether to adaptively determine a motion vector resolution between a default motion vector resolution and an alternate resolution and an image unit for determining an alternative resolution are the same, and each of the two image units is larger than a CU.
  • the embodiment illustrates a large case.
  • the resolution encoder 430 sets an adaptive_MV_resolution_enabled_flag, which is a flag indicating whether to determine the motion vector resolution adaptively. Insert it into the SPS.
  • the resolution encoder 430 is a flag indicating whether to adaptively determine the motion vector resolution, Adaptive_MV_resolution_enabled_flag Is inserted into the PPS.
  • the unit in which the alternative resolution determiner 720 determines the alternative resolution may be determined as an image unit (eg, a slice or a CTU) that is smaller than the image unit in which the Adaptive_MV_resolution_enabled_flag is set and larger than the CU.
  • the resolution encoder 430 encodes alternative_mv_resolution information by generating alternative_mv_resolution information that is information indicating an alternative resolution for each slice or CTU.
  • the resolution encoder 430 selects alternative_mv_resolution information as information for identifying the alternative resolution selected from the predefined plurality of motion vector resolution candidates. Generate and encode.
  • the motion vector resolution of all CUs in the corresponding slice or CTU is not adaptively determined.
  • the resolution encoder 430 encodes Alternative_enabled_flag information by generating Alternative_enabled_flag information, which is a flag indicating whether to use the alternative resolution, for each slice or CTU.
  • alternative_mv_resolution information which is information representing the alternative resolution
  • alternative_mv_resolution information is generated for each slice or CTU, and alternative_mv_resolution information is encoded.
  • the resolution encoder 430 indicates that the default motion vector resolution is used as the motion vector resolution of the current CU.
  • Mv_resolution_flag is generated and information about mv_resolution_flag is encoded.
  • the resolution encoder 430 indicates that the alternative resolution is used as the motion vector resolution of the current CU.
  • Mv_resolution_flag is generated and information about mv_resolution_flag is encoded.
  • an image unit selecting whether to adaptively determine a motion vector resolution between a default motion vector resolution and an alternative resolution is a higher level image unit of an image unit that determines an alternative resolution, and determines an alternative resolution.
  • the image unit is an embodiment illustrating the case of a CU unit.
  • the resolution encoder 430 adaptively determines the motion vector resolution.
  • Adaptive_MV_resolution_enabled_flag which is a flag indicating whether or not to decide, is inserted into the SPS, PPS, slice header, or CTU header, respectively.
  • Adaptive_MV_resolution_enabled_flag is set to ON or OFF depending on the selected result whether to adaptively determine the motion vector resolution.
  • the resolution encoder 430 determines the default motion vector.
  • Mv_resolution_flag is generated indicating that the resolution is used as the motion vector resolution of the current CU, and information about mv_resolution_flag is encoded.
  • the unit in which the alternative resolution determiner 720 determines the alternative resolution is the same CU unit as the unit in which the motion vector resolution is determined.
  • resolution encoder 430 If an alternative resolution other than the default motion vector resolution is used as the motion vector resolution of the current CU, resolution encoder 430 generates an mv_resolution_flag indicating that the alternative resolution is to be used as the motion vector resolution of the current CU, and alternative resolution determiner 720 ) Generates alternative_mv_resolution information, which is information on the alternative resolution, and encodes the information about mv_resolution_flag and alternative_mv_resolution.
  • the resolution encoder 430 encodes the alternative_mv_resolution information as information for identifying the alternative resolution selected from the predefined plurality of motion vector resolution candidates. .
  • the adaptive resolution determiner 730 determines one of the plurality of motion vector resolution candidates as the motion vector resolution of the current CU, instead of determining one of the default motion vector resolution and the alternative resolution as the motion vector resolution of the current CU. You can also decide.
  • the resolution encoder 430 instead of encoding the motion vector resolution information of the current CU, the difference value between the motion vector resolution and the alternative resolution of the current CU.
  • it may be encoded as a difference value between the motion vector resolution of the current CU and the motion vector resolution of the previous CU.
  • FIG. 8 is a diagram illustrating a resolution encoder 430 in the case of encoding motion vector resolution information of a current CU by a resolution difference value.
  • the resolution encoder 430 includes an encoding information generator 810 and a resolution difference calculator 820. Specific operations will be described with reference to the fourth embodiment below.
  • the encoding information generator 810 is a sequence, picture, slice, respectively, which is a higher picture unit.
  • Set Adaptive_MV_resolution_enabled_flag to ON for each unit or CTU unit.
  • the encoding information generator 810 checks whether the default motion vector resolution is used as the motion vector resolution of the CU for each CU in the higher picture unit. If the default motion vector resolution is used as the motion vector resolution of the current CU for the current CU, the encoding information generator 810 sets mv_resolution_flag corresponding to the current CU to OFF. If the default motion vector resolution for the current CU is not used as the motion vector resolution of the current CU and any one selected from a plurality of motion vector resolution candidates is used as the motion vector resolution of the current CU, the encoding information generator 810 Set mv_resolution_flag corresponding to the current CU to ON.
  • the encoding information generator 810 may substitute the determined alternative resolution value for each image unit that is the same as the unit where the Adaptive_MV_resolution_enabled_flag is set. Encodes as information.
  • the unit in which the alternative resolution value is determined is not limited to being determined for each image unit that is the same as the unit in which the Adaptive_MV_resolution_enabled_flag is set, but may be determined for each image unit smaller than the unit in which the Adaptive_MV_resolution_enabled_flag is set or larger than the CU unit.
  • the description thereof has been described above, a detailed description thereof will be omitted.
  • the resolution difference calculator 820 determines a difference value between the motion vector resolution value of the current CU and the motion vector resolution value of the previous CU.
  • a resolution difference value (that is, a value obtained by subtracting the motion vector resolution value of the previous CU from the motion vector resolution value of the current CU) is calculated as an element included in the information about the motion vector resolution of the current CU.
  • the resolution difference calculator 820 determines the motion vector resolution value of the current CU as the resolution difference value information, or replaces the resolution resolution determiner 720.
  • the alternative resolution value determined in may be determined as the resolution difference value information.
  • the resolution difference calculator 820 may determine a difference value between the motion vector resolution value of the current CU and the alternative_mv_resolution value (ie, The resolution difference value, which is the value obtained by subtracting the alternative_mv_resolution value from the motion vector resolution value of the current CU, is calculated as an element included in the information about the motion vector resolution of the current CU.
  • the resolution difference value information determined by the resolution difference calculator 820 is stored as mv_resolution_delta.
  • the operation of the alternative resolution determiner 720 may be omitted.
  • the encoding information generator 810 generates and encodes encoding information about the motion vector resolution of the current CU based on the results of the resolution mode determiner 710 and the adaptive resolution determiner 730.
  • the encoding information generator 810 encodes Adaptive_MV_resolution_enabled_flag ON or OFF according to a result of selecting whether the resolution mode determiner 710 adaptively determines the motion vector resolution of the CUs included in the higher level image unit.
  • the adaptive resolution determiner 730 selects whether to use the default motion vector resolution as the motion vector resolution of the current CU or to determine which one selected from among a plurality of motion vector resolution candidates is the motion vector resolution of the current CU. Can be.
  • the encoding information generator 810 encodes mv_resolution_flag according to the result of this selection, and does not encode mv_resolution_flag when the Adaptive_MV_resolution_enabled_flag is OFF.
  • the encoding information generator 810 calculates the resolution difference calculator 820.
  • Mv_resolution_delta which is information about one resolution difference value, is encoded. If mv_resolution_flag is OFF (that is, the default motion vector resolution is used as the motion vector resolution of the current CU), the encoding information generator 810 does not encode mv_resolution_delta.
  • the resolution encoder 430 may express the resolution difference value as a resolution factor factor by division instead of a value obtained by a ' ⁇ ' operation. Furthermore, the ratio factor may be represented by a log scale, and the specific operation thereof will be described with reference to the fifth embodiment.
  • FIG. 9 is a diagram illustrating a resolution encoder 430 representing a motion vector of a current CU as a resolution ratio factor instead of a resolution difference value.
  • the resolution encoder 430 includes an encoding information generator 910 and a resolution ratio information calculator 920.
  • the resolution ratio information calculator 920 of FIG. 9 may replace the resolution difference calculator 820 of FIG. 8, and the encoding information generator 910 of FIG. 9 may be implemented to replace the encoding information generator 810 of FIG. 8. have.
  • the resolution ratio information calculator 920 calculates the ratio factor, and the resolution difference calculator 820 generates mv_resolution_delta as information on the resolution difference value.
  • the resolution ratio information calculator 920 generates mv_resolution_scale as information on the resolution ratio factor, except that the remaining operations of the resolution difference calculator 820 and the remaining operations of the resolution ratio information calculator 920 are the same. Do.
  • the resolution ratio information calculator 920 may determine a ratio between the motion vector resolution value of the current CU and the motion vector resolution value of the previous CU (that is, the motion vector resolution value of the previous CU from the motion vector resolution value of the current CU).
  • the resolution ratio factor (divided value) is calculated as an element included in the information about the motion vector resolution of the current CU.
  • the resolution ratio information calculator 920 may determine the motion vector resolution value of the current CU as the resolution difference value information or replace the resolution resolution determiner 720 when the current CU is the first CU in the encoding order of the higher level image unit.
  • the alternative resolution value determined in may be determined as the resolution difference value information.
  • the resolution ratio information calculator 920 may determine a resolution ratio factor that is a ratio between the motion vector resolution value of the current CU and the alternative_mv_resolution value (that is, the value obtained by dividing the alternative_mv_resolution value by the motion vector resolution value of the current CU). It calculates as an element included in the information regarding vector resolution.
  • the resolution difference value information determined by the resolution ratio information calculator 920 is stored as mv_resolution_scale.
  • the encoding information generator 910 of FIG. 9 differs from each other in performing only the encoding of the information about the resolution ratio factor (mv_resolution_scale). The remaining operations of the encoded information generator 910 of FIG. 9 of the encoded information generator 810 of FIG. 9 are the same.
  • the unit of the block in which the motion vector resolution is determined is described as CU, but the present invention is not limited thereto.
  • the reference of the block may be CTU, and the motion vector resolution may be used.
  • all CUs included in the CTU may have the same motion vector resolution value.
  • all CUs in the mvp mode among the CUs included in the corresponding CTU may have a motion vector resolution value equal to the motion vector resolution for the corresponding CTU.
  • the image decoding apparatus 1000 includes a decoder 1010, an inverse quantizer 1020, an inverse transformer 1030, a predictor 1040, an adder 1050, a filter 1060, and a memory 1070. .
  • the image decoding apparatus may be implemented as a hardware chip, or may be implemented as software and a microprocessor to execute a function of software corresponding to each component.
  • the decoder 1010 decodes the bitstream received from the image encoding apparatus, extracts information related to block division, determines a current block to be decoded, and includes prediction information and residual signal information necessary for reconstructing the current block. Extract
  • the decoder 1010 extracts information on the CTU size from a Sequence Parameter Set (SPS) or Picture Parameter Set (PPS) to determine the size of the CTU, and divides the picture into a CTU of the determined size.
  • the CTU is determined as the highest layer of the tree structure, that is, the root node, and the CTU is partitioned using the tree structure by extracting partition information about the CTU. For example, when splitting a CTU using a QTBT structure, first, a first flag (QT_split_flag) related to splitting of QT is extracted, and each node is divided into four nodes of a lower layer. For the node corresponding to the leaf node of the QT, the second flag BT_split_flag and the split type information related to the splitting of the BT are extracted to split the corresponding leaf node into the BT structure.
  • SPS Sequence Parameter Set
  • PPS Picture Parameter Set
  • the QT division flag QT_split_flag corresponding to the node of the highest layer of the QTBT structure is extracted. Since the value of the extracted QT split flag QT_split_flag is 1, the node of the highest layer is divided into four nodes of the lower layer (layer 1 of QT). Then, the QT splitting flag QT_split_flag for the first node of layer 1 is extracted. Since the extracted QT split flag (QT_split_flag) has a value of 0, the first node of layer 1 is no longer split into a QT structure.
  • the BT split flag (BT_split_flag) for the first node of (layer 1) split from the root node of BT is extracted. Since the BT split flag BT_split_flag is 1, the split type information of the block of the first node of (layer 1) is extracted. Since the partition type information of the block of the first node of (layer 1) is 1, the block of the first node of (layer 1) is vertically divided. Then, the BT split flag BT_split_flag of the second node of (layer 1) divided from the root node of BT is extracted. Since the BT split flag BT_split_flag is 0, it is no longer split by BT.
  • the decoder 1010 first recursively extracts the QT splitting flag QT_split_flag to split the CTU into a QT structure.
  • the BT split flag (BT_split_flag) is extracted for the leaf node of the QT, and when the BT split flag (BT_split_flag) indicates the split, split type information is extracted.
  • the decoder 1010 may identify that the CTU is divided into a structure as shown in FIG.
  • the decoding unit 1010 extracts the information and uses the information when extracting the split information for QT and BT. Can reflect.
  • the decoder 1010 does not extract the split information (QT splitting flag) regarding the QT of the corresponding block from the bitstream (that is, the QT splitting flag of the corresponding block does not exist in the bitstream), and automatically extracts the value. Set to zero.
  • the decoder 1010 does not extract the BT split flag for the leaf node having a block larger than MaxBTSize in QT, and automatically sets the BT split flag to zero.
  • the decoder 1010 does not extract the BT partition flag of the block having the same size as MinBTSize from the bitstream, and automatically sets the value to zero.
  • the decoder 1010 determines the current block (current block) to be decoded by splitting the tree structure, the decoder 1010 extracts information about a prediction type indicating whether the current block is intra predicted or inter predicted.
  • the decoder 1010 extracts a syntax element for the inter prediction information.
  • mode information indicating whether the motion information of the current block is encoded by which of a plurality of encoding modes is extracted.
  • the plurality of encoding modes include a merge mode and a differential motion vector encoding mode.
  • the decoder 1010 extracts merge index information indicating whether to derive the motion vector of the current block from the candidates among the merge candidates as a syntax element for the motion information.
  • the decoder 1010 extracts the information about the differential motion vector and the reference picture to which the motion vector of the current block refers as a syntax element for the motion vector. do.
  • the prediction motion vector identification information is included in the bitstream. Therefore, in this case, not only the information on the differential motion vector and the reference picture but also the predicted motion vector identification information are extracted as syntax elements for the motion vector.
  • the decoder 1010 extracts information about quantized transform coefficients of the current block as information on the residual signal.
  • the inverse quantizer 1020 inversely quantizes the quantized transform coefficients, and the inverse transformer 1030 inversely transforms the inverse quantized transform coefficients from the frequency domain to the spatial domain to generate a residual block for the current block.
  • the predictor 1040 includes an intra predictor 1042 and an inter predictor 1044.
  • the intra predictor 1042 is activated when the intra prediction is the prediction type of the current block
  • the inter predictor 1044 is activated when the intra prediction is the prediction type of the current block.
  • the intra prediction unit 1042 determines an intra prediction mode of the current block among the plurality of intra prediction modes from a syntax element for the intra prediction mode extracted from the decoder 1010, and references pixels around the current block according to the intra prediction mode. Predict the current block using
  • the inter prediction unit 1044 determines motion information of the current block by using a syntax element of the intra prediction mode extracted from the decoder 1010, and predicts the current block by using the determined motion information.
  • the inter prediction unit 1044 checks mode information in inter prediction extracted from the decoding unit 1010.
  • the inter prediction unit 1044 constructs a merge list including a predetermined number of merge candidates using neighboring blocks of the current block.
  • the inter prediction unit 1044 configures the merge list in the same way as the inter prediction unit 124 of the image encoding apparatus.
  • one merge candidate is selected from the merge candidates in the merge list by using the merge index information transmitted from the decoder 1010.
  • the motion information of the selected merge candidate that is, the motion vector and the reference picture of the merge candidate are set as the motion vector and the reference picture of the current block.
  • the inter prediction unit 1044 derives the predictive motion vector candidates using the motion vectors of the neighboring blocks of the current block, and uses the predictive motion vector candidates for the current block. Determine the predicted motion vector for the motion vector of.
  • the inter prediction unit 1044 derives the prediction motion vector candidates in the same way as the inter prediction unit 124 of the image encoding apparatus derives the prediction motion vector candidates. If the image encoding apparatus uses any one of a plurality of prediction motion vector candidates as the prediction motion vector of the current block, the syntax element for the motion information includes the prediction motion vector identification information. Therefore, in this case, the inter prediction unit 1044 may select a candidate indicated by the prediction motion vector identification information among the prediction motion vector candidates as the prediction motion vector.
  • the inter prediction unit may determine the prediction motion vector by applying the same function as the image encoding apparatus.
  • the inter predictor 1044 determines the motion vector of the current block by adding the predicted motion vector and the differential motion vector transmitted from the decoder 1010.
  • the reference picture referred to by the motion vector of the current block is determined using the information about the reference picture transferred from the decoder 1010.
  • the inter prediction unit 1042 When the motion vector and the reference picture of the current block are determined in the merge mode or the differential motion vector encoding mode, the inter prediction unit 1042 generates the prediction block of the current block using the block indicated by the motion vector in the reference picture. do.
  • the adder 1050 reconstructs the current block by adding the residual block output from the inverse transformer and the prediction block output from the inter predictor or the intra predictor.
  • the pixels in the reconstructed current block are utilized as reference pixels when intra prediction of a block to be decoded later.
  • the filter unit 1060 deblocks and filters the boundary between the reconstructed blocks in order to remove blocking artifacts that occur due to block-by-block decoding and stores them in the memory 1070.
  • the reconstructed picture is used as a reference picture for inter prediction of a block in a picture to be decoded later.
  • FIG. 11 is a diagram illustrating an image decoding apparatus 1100 according to an embodiment of the present invention.
  • the image decoding apparatus 1100 includes a motion vector resolution decoder 1110 and an image decoder 1120.
  • the motion vector resolution decoder 1110 extracts information about the motion vector resolution of the current CU from the bitstream, and determines a motion vector resolution for estimating the motion of the current CU based on the extracted information about the motion vector resolution. .
  • the image decoder 1120 predicts and decodes the current CU using the motion vector of the current CU determined according to the motion vector resolution of the current CU.
  • the image decoder 1120 may be implemented as the image decoding apparatus 1000 described above with reference to FIG. 10.
  • the function of the motion vector resolution decoder 1110 may be included in the function of the decoding unit 1010 in the image decoding apparatus 1000 and may be integrally implemented with the decoding unit 1010.
  • FIG. 12 is a flowchart illustrating a method of decoding an image in the image decoding apparatus 1100 according to the first embodiment of the present invention.
  • the motion vector resolution decoder 1110 extracts Adaptive_MV_resolution_enabled_flag (ie, first identification information) from the bitstream (S1210). ).
  • Adaptive_MV_resolution_enabled_flag is identification information indicating whether the motion vector resolution is adaptively determined and is information determined by at least one image unit among an image sequence, a picture, a slice, and a CTU, which is a higher level image unit, and is an image sequence, picture, slice, and CTU. It is extracted from the bitstream header of at least one of the higher level video unit.
  • the motion vector resolution decoder 1110 determines whether the meaning of Adaptive_MV_resolution_enabled_flag means that the motion vector resolution of CUs in the higher level image unit is adaptively determined (i.e., when Adaptive_MV_resolution_enabled_flag is ON) or the default motion vector resolution. Check whether is used as the motion vector resolution of the CUs in the higher level image unit (ie, when Adaptive_MV_resolution_enabled_flag is OFF) (S1220).
  • step S1220 when Adaptive_MV_resolution_enabled_flag is ON, the motion vector resolution decoder 1110 extracts alternative_mv_resolution, which is information about the alternative resolution, from the bitstream (S1230).
  • alternative_mv_resolution may be extracted for each image unit such as the image unit in which the Adaptive_MV_resolution_enabled_flag is transmitted, or may be extracted from the bitstream for each image unit smaller than the image unit in which the Adaptive_MV_resolution_enabled_flag is transmitted.
  • alternative_mv_resolution may be extracted for each CU unit in which a motion vector resolution in an image unit in which Adaptive_MV_resolution_enabled_flag is transmitted is determined.
  • the motion vector resolution decoder 1110 determines the motion vector resolution of the encoding target CU according to whether the encoding mode of the encoding target CU (that is, the current CU) is a mode for encoding the differential motion vector (S1240). ).
  • the motion vector resolution may be adaptively determined for each CU in the higher picture unit.
  • Adaptive_MV_resolution_enabled_flag when information on Adaptive_MV_resolution_enabled_flag is transmitted for each higher picture unit among an image sequence and a picture and alternative_mv_resolution is transmitted in a bitstream for each slice (or CTU) that is smaller than the higher picture unit, the picture in the slice (or CTU)
  • the motion vector resolution may be adaptively determined for each CU that is a unit.
  • the motion vector resolution decoder 1110 determines the motion vector resolution of the CU to be encoded according to whether the encoding mode of the current CU is a mode for encoding the differential motion vector. S1240 is performed.
  • operation S1240 includes steps S1241 to S1246.
  • the motion vector resolution decoder 1110 decodes the encoding mode of the current CU from the bitstream after step S1230, and the encoding mode of the current CU encodes the differential motion vector using the predictive motion vector (that is, the mvp mode). Check whether or not (S1241).
  • the motion vector resolution decoder 1110 determines that the motion vector resolution of CUs in the higher level image unit is adaptively determined by the meaning of Adaptive_MV_resolution_enabled_flag. It is checked whether it means (ie, when Adaptive_MV_resolution_enabled_flag is ON) or when the default motion vector resolution is used as motion vector resolution of CUs in the higher level image unit (ie, when Adaptive_MV_resolution_enabled_flag is OFF) (S1242).
  • step S1242 when Adaptive_MV_resolution_enabled_flag is ON, the motion vector resolution decoder 1110 determines whether mv_resolution_flag which is identification information indicating which of the default motion vector resolution and the alternative resolution is used as the motion vector resolution of the current CU (ie, , Second identification information) is decoded from the bitstream (S1243), and after S1243, the process goes below S1244.
  • mv_resolution_flag which is identification information indicating which of the default motion vector resolution and the alternative resolution is used as the motion vector resolution of the current CU (ie, , Second identification information) is decoded from the bitstream (S1243), and after S1243, the process goes below S1244.
  • mv_resolution_flag has been described as being transmitted in units of CUs, according to an embodiment, mv_resolution_flag is decoded in units of CTUs, and whether the CUs are in mvp mode for each CU in the corresponding CTUs is determined. It may be implemented.
  • the motion vector resolution decoder 1110 After decoding the mv_resolution_flag, the motion vector resolution decoder 1110 checks what the meaning of the mv_resolution_flag is (S1244).
  • the motion vector resolution decoder 1110 sets the alternative resolution as the motion vector resolution of the current CU. Determine (S1245).
  • step S1244 when mv_resolution_flag indicates that the default motion vector resolution is used as the motion vector resolution of the current CU (that is, mv_resolution_flag is OFF), the motion vector resolution decoder 1110 sets the default motion vector resolution to the current CU. Determine as the motion vector resolution of (S1246).
  • the motion vector resolution decoder 1110 determines the default motion vector resolution as the motion vector resolution of the current CU (S1246).
  • Adaptive_MV_resolution_enabled_flag indicating whether to adaptively determine the motion vector resolution
  • alternative_mv_resolution syntax indicating the alternative resolution
  • the motions of all CUs in the video sequence referring to the SPS are the same.
  • Vector resolution is determined by 1 / 4-pixel or 4-pixel. That is, if mv_resolution_flag, which is header information of the current CU, is off, the motion vector resolution of the current CU is determined to be 1 / 4-pixel corresponding to the default motion vector resolution. If mv_resolution_flag of the current CU is on, the motion vector resolution of the current CU is It is determined as 4-pixel corresponding to the alternative resolution.
  • Adaptive_MV_resolution_enabled_flag and the alternative_mv_resolution syntax exist in the PPS (or slice header), it may be determined whether to apply the method of the present invention in picture units (or slice units).
  • the Adaptive_MV_resolution_enabled_flag of the PPS is on and the alternative_mv_resolution value (i.e., alternative resolution) of the PPS is 4 pixels and the default motion vector resolution is 1 / 4-pixel, then the picture (or slice) referencing the PPS (or slice header) )
  • the motion vector resolution of the current CU to be encoded is determined to be 1 / 4-pixel or 4-pixel.
  • the motion vector resolution of the current CU is determined to be 1 / 4-pixel corresponding to the default motion vector resolution
  • mv_resolution_flag of the current CU is on
  • the motion vector of the current CU is The resolution is determined as 4-pixel corresponding to the alternative resolution.
  • Adaptive_MV_resolution_enabled_flag is On in the SPS (or PPS) and the alternative_mv_resolution value of the header of the slice (or CTU), which is an image unit smaller than the image sequence (or picture), is 4 pixels and the default motion vector resolution is 1 / 4-pixel
  • the resolution of the motion vectors of all CUs to be encoded in the slice (or CTU) is determined to be 1 / 4-pixel corresponding to the default motion vector resolution or 4-pixel corresponding to the alternative_mv_resolution value so that the motion vector of the current CU is 1/4. It is expressed in -pixel or 4-pixel units.
  • mv_resolution_flag which is header information of the CU to be encoded
  • motion information of the current CU is expressed in 1 / 4-pixel
  • mv_resolution_flag of the current CU is on, it is expressed in 4-pixel units.
  • Adaptive_MV_resolution_enabled_flag is On in the SPS (or PPS) and the alternative_mv_resolution value of the header of the slice (or CTU), which is an image unit smaller than the image sequence (or picture), is 0 and the default motion vector resolution is 1 / 4-pixel
  • the resolution of the motion vectors of all CUs to be encoded in the slice (or CTU) is determined to be 1 / 4-pixel corresponding to the default motion vector resolution so that the motion vectors of the current CU are expressed in 1 / 4-pixel units.
  • mv_resolution_flag which is header information of the CU to be encoded, is not necessary.
  • the motion of all CUs within the slice (or CTU) according to the value of Alternative_enabled_flag of the header of the slice (or CTU) that is Adaptive_MV_resolution_enabled_flag is On in the SPS (or PPS) and is smaller than the image sequence (or picture).
  • Determine the resolution of the vector For example, if Alternative_enabled_flag is off and the default motion vector resolution is 1 / 4-pixel, the resolution of the motion vectors of all CUs in the slice (or CTU) in that slice (or CTU) is 1 / 4-pixel corresponding to the default motion vector resolution.
  • mv_resolution_flag which is header information of the CU to be encoded, is not necessary.
  • Alternative_enabled_flag is on and alternative_mv_resolution is 4 pixels and the default motion vector resolution is 1 / 4-pixel
  • the resolution of the motion vectors of all CUs in the slice (or CTU) in that slice (or CTU) is 1 / corresponding to the default motion vector resolution.
  • a 4-pixel or 4-pixel corresponding to the alternative_mv_resolution value is determined, and the motion vector of the current CU is expressed in 1 / 4-pixel or 4-pixel units.
  • mv_resolution_flag which is header information of the CU to be encoded
  • motion information of the current CU is expressed in 1 / 4-pixel
  • mv_resolution_flag of the current CU is on, it is expressed in 4-pixel units.
  • FIG. 13 is a diagram illustrating an example of adaptively determining a resolution.
  • the alternative_mv_resolution value of the slice # 0 header is 2 pixels, and the default MV resolution is 1 / 4-pixel, the encoding including the circle shape in the slice # 0 is performed.
  • the motion vector resolution of the target CU is determined to be 1 / 4-pixel corresponding to the default motion vector resolution or 2-pixel corresponding to alternative_mv_resolution.
  • mv_resolution_flag which is header information of the CU to be encoded
  • the motion vector of the current CU is expressed in 1 / 4-pixel units corresponding to the default motion vector resolution.
  • the motion vector of the current CU is Is expressed in 2-pixel units corresponding to alternative_mv_resolution.
  • the motion vector resolution of the CU to be encoded including the triangular shape in slice # 1 is 1 / 4-pixel corresponding to the default motion vector resolution or 4-pixel corresponding to alternative_mv_resolution. Is determined.
  • mv_resolution_flag which is header information of the CU to be encoded
  • the motion vector of the current CU is represented by 1 / 4-pixel corresponding to the default motion vector resolution.
  • mv_resolution_flag of the current CU is on, the motion vector of the current CU is represented. It is expressed in a 4-pixel unit corresponding to alternative_mv_resolution.
  • operation S1250 includes steps S1251 to S1255.
  • the image decoder 1120 derives prediction motion vector candidates, and extracts information mvp_idx from the bitstream to identify the prediction motion vector of the current CU from the prediction motion vector candidates.
  • the neighboring blocks used for the prediction motion vector candidates include a left block L, an upper block A, a right upper block AR, and a lower left block adjacent to the current CU in the current picture shown in FIG. 3. BL), all or part of the upper left block AL may be used.
  • the image decoder 1120 checks whether the motion vector resolution of the block corresponding to mvp_idx is equal to the motion vector resolution of the current CU (S1252).
  • the image decoder 1120 decodes the differential motion vector from the bitstream (S1254). If it is confirmed that the prediction motion vector resolution corresponding to mvp_idx is different from the motion vector resolution of the current CU, scaling of the size of the prediction motion vector is performed so that the resolution of the prediction motion vector is the same as the motion vector resolution of the current CU. (S1253) A differential motion vector is decoded from the bitstream (S1254).
  • the image decoder 1120 After decoding the differential motion vector from the bitstream, the image decoder 1120 calculates the motion vector of the current CU by adding the differential motion vector and the predicted motion vector (S1255).
  • the motion vector resolution of the current CU is 2-pixel and the motion vector resolution of the block corresponding to mvp_idx is 1 / 4-pixel and the motion vector value of the block corresponding to mvp_idx is set to 3, this corresponds to mvp_idx. Since the actual motion vector value of the block corresponds to 0.75, scaling to the 2-pixel motion vector resolution corresponding to the motion vector resolution of the current CU converts the actual motion vector value of the block corresponding to mvp_idx to zero. The conversion formula for this is shown in Equation 1.
  • MV ' Round (MV ⁇ neighbor_MV_Resol / curr_MV_Resol)
  • MV is a motion vector value of the block corresponding to mvp_idx
  • neighboring_MV_resol is a motion vector resolution value of the block corresponding to mvp_idx
  • current_MV_resol is a motion vector resolution value of the current CU
  • MV ' is a scaled actual motion vector value. Round means round operation.
  • Adaptive_MV_resolution_enabled_flag, mv_resolution_flag, and alternative_mv_resolution may be individually set according to the coordinates of the x-axis and the y-axis, and the motion vector resolution of the current CU is also individually according to the coordinates of the x-axis and the y-axis, as shown in Equation 2. It can also be calculated.
  • MV x ' Round (MV x ⁇ neighbor_MV x _Resol / curr_MV x _Resol)
  • MV y ' Round (MV y ⁇ neighbor_MV y _Resol / curr_MV y _Resol)
  • step S1241 the encoding mode of the current CU is not the mvp mode (eg, the merge mode)
  • the motion vector of the temporal or spatial neighboring block ie, the merge candidates
  • step S1260 the motion vector of the current CU is derived.
  • operation S1260 includes steps S1261 to S1264.
  • the image decoder 1120 may determine information (candid_idx) for identifying a motion vector of the current CU from merge candidates of the current CU when it is determined in operation S1241 that the encoding mode of the current CU is not the mvp mode. Extract from the bitstream (S1261).
  • the merge candidates of the current CU are selected from among a left block L, an upper block A, an upper right block AR, a lower left block BL, and an upper left block AL adjacent to the current CU in the current picture shown in FIG. 3. All or part may be used.
  • a block located within a reference picture (which may be the same as or different from the reference picture used to predict the current CU) where the current CU is located may be used as a motion vector candidate (ie, a merge candidate).
  • a motion vector candidate ie, a merge candidate
  • a co-located block in the reference picture or blocks adjacent to the block in the same location in the reference picture may be further used as a merge candidate.
  • the image decoder 1120 checks whether the motion vector resolution of the block corresponding to candid_idx extracted from the bitstream is the same as the motion vector resolution defined for the merge mode (S1262).
  • the motion vector resolution predefined for the merge mode may be a motion vector resolution defined in any one unit among an image sequence, a picture, and a slice.
  • the image decoder 1120 determines the motion vector of the block corresponding to candid_idx as the motion vector of the current CU. (S1264). If the motion vector resolution of the block corresponding to candid_idx is different from the predefined motion vector resolution, the motion vector of the block corresponding to candid_idx is set such that the motion vector resolution of the block corresponding to candid_idx is equal to the predefined motion vector resolution. The scaled motion vector is determined as the motion vector of the current CU (S1264).
  • operations S1240, S1250, and S1260 may be sequentially and repeatedly performed for each coding unit CU.
  • FIG. 14 is a flowchart illustrating a case in which some steps are added to the flowchart of FIG. 12.
  • operation S1240 includes steps S1241, S1242_1, S1242_2, S1243, S1244, S1245, and S1246.
  • operation S1250 in FIG. 14 includes steps S1251, S1252, S1253, and S1255.
  • steps S1242_1 and S1242_2 are added instead of step S1242 of FIG. 12 in operation S1240, and step S1254 of FIG. 12 is excluded in operation S1250.
  • step S1243 of FIG. 14 are the same as operations of step S1243 of FIG. 12.
  • the image decoder 1120 decodes the information mvd about the differential motion vector from the bitstream (S1242_1).
  • the motion vector resolution decoder 1110 After decoding the differential motion vector in step S1242_1, the motion vector resolution decoder 1110 checks whether the differential motion vector is not zero and whether Adaptive_MV_resolution_enabled_flag is ON (S1242_2). If the differential motion vector is not 0 and Adaptive_MV_resolution_enabled_flag is ON, the flow proceeds to step S1243. If the differential motion vector is 0 or the Adaptive_MV_resolution_enabled_flag is not ON, the flow proceeds to step S1246.
  • the image decoder 1120 determines the differential motion vector and the prediction.
  • a motion vector of the current CU is calculated by summing the motion vectors (S1255).
  • the resolution of the prediction motion vector is equal to the motion vector resolution of the current CU.
  • Step S1253 is performed to scale the size of the predicted motion vector to be the same, and after step S1253, the step S1255 is performed to calculate the motion vector of the current CU by adding the differential motion vector and the predicted motion vector.
  • step S1251 may be executed before step S1242_1 or may be executed between step S1242_1 and S1242_2.
  • 15 is a flowchart illustrating a method of decoding an image in the image decoding apparatus 1100 according to the second embodiment of the present invention.
  • Adaptive_MV_resolution_enabled_flag when Adaptive_MV_resolution_enabled_flag is present in an SPS (PPS, slice, or CTU header) and mv_resolution_flag and alternative_mv_resolution information exist in an encoding target CU header, an image sequence unit (picture unit, slice) Unit, or CTU unit) to determine whether to apply the adaptive motion vector resolution determination method of the present invention according to the Adaptive_MV_resolution_enabled_flag value, and to select whether to determine the adaptive motion vector in units of the CU as a coding block unit according to the mv_resolution_flag value
  • the motion vector resolution can be adjusted.
  • Adaptive_MV_resolution_enabled_flag of the SPS header PPS header, slice header, or CTU header
  • the default motion vector resolution is 1 / 4-pixel
  • mv_resolution_flag which is the header information of the current CU to be encoded
  • the alternative_mv_resolution information is not needed to determine the motion vector resolution of.
  • the motion vector resolution of the current CU is determined as 1 / 4-pixel corresponding to the default motion vector resolution, and the motion vector of the current CU is expressed in units of 1 / 4-pixel.
  • the motion vector resolution of the current CU is determined to be 4-pixel corresponding to the alternative_mv_resolution value, so that the motion vector of the current CU is 4- corresponding to the alternative_mv_resolution value. It is expressed in pixel units.
  • the motion vector resolution decoder 1110 extracts Adaptive_MV_resolution_enabled_flag from the bitstream (S1510).
  • Adaptive_MV_resolution_enabled_flag is identification information indicating whether the motion vector resolution is adaptively determined and is information determined by at least one image unit (a higher level image unit of a CU) of an image sequence, a picture, a slice, and a CTU. It is extracted from a bitstream header of at least one video unit of a slice and a CTU.
  • the motion vector resolution decoder 1110 extracts Adaptive_MV_resolution_enabled_flag for each image unit of at least one of an image sequence, a picture, a slice, and a CTU, and then the encoding mode of each block in the image unit for extracting the Adaptive_MV_resolution_enabled_flag is a mode for encoding a differential motion vector.
  • the motion vector resolution is determined for each block according to whether or not it is performed (S1540).
  • operation S1540 includes steps S1541 to S1547.
  • the motion vector resolution decoder 1110 decodes the encoding mode of the current CU from the bitstream after step S1510, and encodes the differential motion vector using the predictive motion vector (ie, the mvp mode). ) Is checked (S1541).
  • step S1541 If it is determined in step S1541 that the encoding mode of the current CU is mvp mode, whether the meaning of the Adaptive_MV_resolution_enabled_flag means that the motion vector resolution of the CUs in the higher level image unit is adaptively determined (that is, the Adaptive_MV_resolution_enabled_flag is ON). Case) or whether the default motion vector resolution is used as the motion vector resolution of the CUs in the higher level image unit (that is, when Adaptive_MV_resolution_enabled_flag is OFF) (S1542).
  • the motion vector resolution decoder 1110 uses the default motion vector resolution as the motion vector resolution of the current CU (S1547).
  • the motion vector resolution decoder 1110 bitizes mv_resolution_flag, which is identification information indicating which of the default motion vector resolution and the alternative resolution is used as the motion vector resolution of the current CU. Decode from the stream (S1543).
  • the motion vector resolution decoder 1110 After decoding the mv_resolution_flag, the motion vector resolution decoder 1110 checks what the meaning of the mv_resolution_flag is (S1544).
  • step S1544 when mv_resolution_flag indicates that the alternative resolution is used as the motion vector resolution of the current CU (that is, mv_resolution_flag is ON), the motion vector resolution decoder 1110 is information about the alternative resolution of the current CU.
  • alternative_mv_resolution is extracted from the bitstream (S1545), and the extracted alternative resolution is determined as the motion vector resolution of the current CU (S1546).
  • the motion vector resolution decoder 1110 sets the default motion vector resolution to the current CU. It is determined as the motion vector resolution of (S1547).
  • mv_resolution_flag and / or alternative_mv_resolution information has been described as being transmitted in a CU unit, according to an embodiment, the mv_resolution_flag and / or alternative_mv_resolution are decoded in a CTU unit, and whether the corresponding CU is mvp by checking the mvp mode for each CU in the corresponding CTU. If the mode is S1540 or less may be implemented through the process.
  • 16 is a diagram illustrating another example of adaptively determining a resolution.
  • the Adaptive_MV_resolution_enabled_flag of the SPS header (PPS header, slice header, or CTU header) is on
  • the default motion vector resolution is 1 / 4-pixel
  • the mv_resolution_flag of the header of the encoding target CU that is circular in the image sequence is on and alternative_mv_resolution. If the value is 1 pixel, the motion vector resolution of the CUs to be encoded is determined to be 1-pixel corresponding to the alternative_mv_resolution value, and the motion vectors of the CUs to be encoded are expressed in 1-pixel units.
  • the motion vector resolution of the CU to be encoded is determined to be 4-pixel corresponding to the alternative_mv_resolution value to be encoded.
  • the motion vector of the CU is expressed in 4-pixel units corresponding to the alternative_mv_resolution value.
  • the motion vector resolution of the encoding CU is determined to be 1 / 4-pixel corresponding to the default motion vector resolution, and the motion vector of the encoding target CU is the default motion vector resolution. It can be expressed in 1 / 4-pixel units corresponding to.
  • the image decoder 1120 derives the motion vector of the current block by using the prediction motion vector (S1550).
  • operation S1550 includes steps S1551 to S1555.
  • steps S1551 to S1555 perform operations similar to those of steps S1251 to S1255, respectively, detailed descriptions of steps S1551 to S1555 are omitted.
  • step S1341 When the image decoder 1120 confirms in step S1341 that the encoding mode of the corresponding CU is not the mvp mode (eg, the merge mode), the motion vector of the temporal or spatial neighboring block (ie, the merge candidates).
  • step S1560 the motion vector of the current CU is derived.
  • operation S1560 includes steps S1561 to S1564.
  • steps S1561 to S1564 perform operations similar to those of steps S1261 to S1264, respectively, detailed descriptions of steps S1561 to S1564 are omitted.
  • 17 is a flowchart illustrating a case in which some steps are added to the flowchart of FIG. 15.
  • operation S1540 includes steps S1541, S1542_1, S1542_2, S1543, S1544, S1545, S1546, and S1547.
  • operation S1550 in FIG. 17 includes steps S1551, S1552, S1553, and S1555.
  • step S1543 of FIG. 17 are the same as operations of step S1543 of FIG. 15.
  • step S1541 as a result of checking whether the encoding mode of the current CU is a mode for encoding a differential motion vector using the predictive motion vector (that is, the mvp mode) in step S1541, it is confirmed that the encoding mode of the current CU is the mvp mode.
  • the image decoder 1120 decodes the information mvd about the differential motion vector from the bitstream (S1542_1).
  • the motion vector resolution decoder 1110 After decoding the differential motion vector in step S1542_1, the motion vector resolution decoder 1110 checks whether the differential motion vector is not zero and whether Adaptive_MV_resolution_enabled_flag is ON (S1542_2). If it is confirmed in step S1542_2 that the differential motion vector is not 0 and Adaptive_MV_resolution_enabled_flag is ON, the flow proceeds to step S1543. If the differential motion vector is 0 or the Adaptive_MV_resolution_enabled_flag is not ON, the flow proceeds to step S1547.
  • step S1551 may be executed before step S1542_1 or may be executed between step S1542_1 and S1542_2.
  • Steps S1551, S1552, S1553, and S1555 of FIG. 17 perform operations similar to those of steps S1251, S1252, S1253, and S1255 of FIG. 14, respectively, and thus detailed descriptions of steps S1551, S1552, S1553, and S1555 of FIG. 17 are omitted.
  • FIG. 18 is a flowchart illustrating a method of decoding an image in the image decoding apparatus 1100 according to the third embodiment of the present invention.
  • the motion vector resolution decoder 1110 extracts Adaptive_MV_resolution_enabled_flag from the bitstream (S1810).
  • Adaptive_MV_resolution_enabled_flag is identification information indicating whether the motion vector resolution is adaptively determined and is information determined by at least one image unit among an image sequence, a picture, a slice, and a CTU, which is a higher level image unit, and is an image sequence, picture, slice, and CTU. Is extracted from a bitstream header of at least one video unit.
  • the motion vector resolution decoder 1110 adaptively adapts the motion vector resolution to the meaning of Adaptive_MV_resolution_enabled_flag in at least one higher level image unit of an image sequence, picture, slice, and CTU (that is, in all CUs in the higher level image unit). It is checked whether it is determined (ie, if it is ON) or if the default motion vector resolution is used as the motion vector resolution of all CUs in the higher level image unit (ie, if it is OFF) (S1820).
  • the motion vector resolution decoder 1110 uses the default motion vector resolution as the motion vector resolution of the corresponding CUs in the case of the CUs within the corresponding video unit (S1822).
  • the motion vector resolution decoder 1110 extracts alternative_mv_resolution, which is information about the alternative resolution, from the bitstream (S1830).
  • alternative_mv_resolution may be extracted from the bitstream for each image unit that is the same as the image unit to which the Adaptive_MV_resolution_enabled_flag is transmitted.
  • alternative_mv_resolution may be extracted from the bitstream for each image unit smaller than the CU unit which is smaller than the image unit to which the Adaptive_MV_resolution_enabled_flag is transmitted and the motion vector resolution is determined.
  • the unit from which the alternative_mv_resolution is extracted may be a slice unit (or a CTU unit).
  • alternative_mv_resolution may be extracted for each CU that is a block unit in which the motion vector resolution in the image unit to which the Adaptive_MV_resolution_enabled_flag is transmitted is determined.
  • alternative_mv_resolution may not be extracted at any position.
  • the motion vector resolution decoder 1110 determines the motion vector resolution of the current CU according to whether the encoding mode of the current CU is a mode for encoding the differential motion vector (S1840).
  • operation S1840 includes steps S1841 to S1848.
  • the motion vector resolution decoder 1110 decodes the encoding mode of the current CU from the bitstream, and encodes the differential motion vector using the predictive motion vector in the encoding mode of the current CU (ie, the mvp mode). Check whether or not (S1841).
  • the motion vector resolution decoder 1110 determines that the motion vector resolution of CUs in the higher level image unit is adaptively determined by the meaning of Adaptive_MV_resolution_enabled_flag. It is checked whether it means (ie, when Adaptive_MV_resolution_enabled_flag is ON) or when the default motion vector resolution is used as motion vector resolution of CUs in the higher level image unit (that is, when Adaptive_MV_resolution_enabled_flag is OFF) (S1842).
  • the motion vector resolution decoder 1110 bitizes mv_resolution_flag, which is identification information indicating which of the default motion vector resolution and the alternative resolution is used as the motion vector resolution of the current CU. Decode from the stream (S1843).
  • the motion vector resolution decoder 1110 determines the default motion vector resolution as the motion vector resolution of the current CU (S1848).
  • the motion vector resolution decoder 1110 After decoding the mv_resolution_flag of the current CU in step S1843, the motion vector resolution decoder 1110 checks what the meaning of mv_resolution_flag is (S1844).
  • mv_resolution_flag indicates that the motion vector resolution of the current CU is determined using a resolution difference value that is a difference between the motion vector resolution value of the current CU and the motion vector resolution value of the previous CU (ie, , mv_resolution_flag is ON)
  • the motion vector resolution decoder 1110 extracts mv_resolution_delta, that is, information about a difference value between the motion vector resolution value of the current CU and the motion vector resolution value of the previous CU, from the bitstream (S1845).
  • mv_resolution_delta may function as information indicating the motion vector resolution of the current CU.
  • the motion vector resolution decoder 1110 calculates a motion vector resolution value of the current CU using the mv_resolution_delta value (S1846) and determines the calculated result as the motion vector resolution of the current CU (S1847).
  • step S1844 when mv_resolution_flag indicates that the default motion vector resolution is used as the motion vector resolution of the current CU (that is, mv_resolution_flag is OFF), the motion vector resolution decoder 1110 sets the default motion vector resolution to the current CU. It is determined as the motion vector resolution of (S1848).
  • the motion vector resolution decoder 1110 determines the mv_resolution_delta value as the motion vector resolution value of the current CU when the current CU is the first CU in the encoding order of the higher level image unit.
  • the motion vector resolution decoder 1110 may determine the motion vector resolution of the CU encoded immediately before the encoding of the current CU in the encoding order.
  • a motion vector resolution value of the current CU is calculated by summing the value and the resolution difference value mv_resolution_delta. In this case, since the motion vector resolution decoder 1110 does not need alternative_mv_resolution to generate the motion vector resolution of the current CU, the operation of extracting the alternative_mv_resolution from the bitstream may be omitted.
  • the motion vector resolution of the current CU is determined as 1 / 4-pixel, which is the default motion vector resolution, and the motion vector of the current CU is expressed in 1 / 4-pixel units, which is the default motion vector resolution.
  • the motion vector resolution of the current CU is 4-pixel corresponding to the mv_resolution_delta value and the current CU motion.
  • Vectors are represented in 4-pixel units.
  • the motion vector resolution of the current CU is equal to the mv_resolution_delta value of the current CU to the motion vector resolution of the previous CU of the current CU.
  • the resolution is determined as 4-pixel, which is the sum of resolutions, and the motion vector of the current CU is expressed in 4-pixel units.
  • the motion vector resolution of the current CU is set to 4 pixels that is the motion vector resolution of the previous CU. It is determined as 2-pixel which is the result of summing -2 pixels corresponding to the mv_resolution_delta value, and the motion vector of the current CU is expressed in 2-pixel units.
  • the motion vector resolution decoder 1110 restores the motion vector resolution of the current CU by adding mv_resolution_delta to the motion vector resolution of the previous CU of the current CU. It is not limited to this. That is, the motion vector resolution decoder 1110 may be implemented to add the mv_resolution_delta value and the alternative resolution value of the current CU to decode the motion vector resolution value of the current CU.
  • Adaptive_MV_resolution_enabled_flag and alternative_mv_resolution exist in the Slice (Tile) header (or SPS PPS, CTU) and are in a Slice (Tile) (or image sequence, picture, or CTU) unit. If mv_resolution_flag and mv_resolution_delta information exist in the header of the CU, whether the adaptive motion vector resolution determination method and the alternative resolution of the present invention are applied in slice (Tile) (or image sequence, picture, CTU) unit according to the Adaptive_MV_resolution_enabled_flag value.
  • the motion vector resolution of the current CU is determined using the mv_resolution_delta value while adaptively determining the motion vector resolution in CU units within a slice (Tile) (or image sequence, picture, or CTU) unit according to the mv_resolution_flag value of the current CU. I can adjust it.
  • Tile image sequence, picture, or CTU
  • the mv_resolution_delta value of the current CU is expressed as a difference value between an alternative_mv_resolution value (ie, an alternative resolution) described in a Slice (Tile) header (or an image sequence, a picture, or a CTU) and a motion vector resolution value of the current CU.
  • the motion vector resolution value of the current CU may be calculated as a result of adding the alternative_mv_resolution value and the mv_resolution_delta value.
  • the alternative_mv_resolution value of alternative resolution is 4 pixels
  • the default motion vector resolution is 1 / 4-pixel
  • mv_resolution_flag the header information of the current CU to be encoded
  • the mv_resolution_delta information is not needed to determine the motion vector resolution.
  • the motion vector resolution of the current CU becomes 1 / 4-pixel corresponding to the default motion vector resolution, and the motion vector of the current CU is expressed in units of 1 / 4-pixel.
  • the motion vector resolution of the current CU is determined to be 4-pixel corresponding to the alternative_mv_resolution value and the mv_resolution_delta value, so that the motion vector of the current CU is 4 It is expressed in -pixel units. If mv_resolution_flag of the current CU is on and the mv_resolution_delta value of the current CU is -2 pixels, the motion vector resolution of the current CU is -2 pixels corresponding to the mv_resolution_delta value at 4-pixel, which is an alternative resolution value of the slice header. The result of the summation is 2-pixel, and the current vector motion vector resolution is determined by the sum result of 2-pixel.
  • mv_resolution_flag and mv_resolution_delta information is present in a header of a CU in a slice (Tile) (or image sequence, picture, or CTU) unit
  • a CU unit in a slice (Tile) (or image sequence, picture, CTU) unit according to the mv_resolution_flag value
  • the motion vector resolution of the current CU can be adjusted using the mv_resolution_delta value.
  • the mv_resolution_delta value of the current CU is expressed as a difference value between the alternative_mv_resolution value described in the Slice (Tile) header (or SPS, PPS, CTU) and the motion vector resolution of the current CU, or is based on the current CU. This may be expressed as a difference value between the motion vector resolution value of the CU previously encoded and the motion vector resolution value of the current CU.
  • the mv_resolution_delta value of the current CU is the value between the alternative resolution (alternative_mv_resolution) value described in the Slice (Tile) (or SPS, PPS, CTU) header and the motion vector resolution of the current CU.
  • the current CU is a non-first-order CU
  • the current mv_resolution_delta value of the current CU is determined between the motion vector resolution value of the CU previously encoded and the motion vector resolution of the current CU. It can be expressed as a difference value.
  • Adaptive_MV_resolution_enabled_flag of the slice header is on
  • the mv resolution value of the alternative resolution is 4 pixels
  • the default motion vector resolution is 1 / 4-pixel
  • mv_resolution_flag the header information of the current CU to be encoded
  • the mv_resolution_delta information is not necessary for determining the motion vector resolution of the current CU.
  • the motion vector resolution of the current CU is determined to be 1 / 4-pixel corresponding to the default motion vector resolution.
  • mv_resolution_flag which is the header information of the current CU
  • the current CU is the first CU
  • the mv_resolution_delta value of the current CU is +2 pixels
  • the alternative resolution value 4 pixels described in the slice (Tile) header and the current CU Since the difference value between the resolution of the motion vector is +2 pixels, the motion vector resolution of the current CU is 6-pixel by adding 4 pixels of the alternative_mv_resolution value and the resolution difference value +2 pixel.
  • the motion vector resolution of the next CU is mv_resolution_delta of the next CU at 6 pixels, the motion vector resolution value of the previous CU. Add the value -2 pixel to 4-pixel.
  • step S1847 or step S1848 of FIG. 18 the image decoder 1120 derives a motion vector of the current CU using the predicted motion vector (S1850).
  • operation S1850 includes steps S1851 to S1855.
  • the image decoder 1120 determines that the encoding mode of the current CU is not the mvp mode (eg, the merge mode).
  • the image decoder 1120 determines the motion vector of the temporal or spatial neighboring block (ie, the merge candidates).
  • a motion vector of the current CU is derived.
  • operation S1860 includes steps S1861 to S1864.
  • Steps S1861 to S1864 of FIG. 18 perform operations similar to those of steps S1261 to S1264 of FIG. 12, respectively, and thus detailed descriptions of steps S1861 to S1864 are omitted.
  • FIG. 18 is a flowchart illustrating not only an operation of the image decoding apparatus 1100 according to the third embodiment of the present invention but also an operation of the image decoding apparatus 1100 according to the fourth embodiment of the present invention. to be.
  • the image decoder 1120 may decode mv_resolution_scale from the bitstream instead of mv_resolution_delta and restore the motion vector resolution of the current CU using the decoded mv_resolution_scale.
  • step S1845 is implemented to extract the mv_resolution_scale from the bitstream, and in step S1846 to restore the motion vector resolution of the current CU using the mv_resolution_scale.
  • the motion vector resolution decoder 1110 uses the resolution ratio factor which is a value obtained by dividing the motion vector resolution value of the current CU by the motion vector resolution value of the current CU as a result of the check in step S1844. If mv_resolution_flag indicates to determine the motion vector resolution of (i.e., mv_resolution_flag is ON), the motion vector resolution decoder 1110 divides the motion vector resolution of the current CU by the motion vector resolution of the current CU.
  • the mv_resolution_scale which is information indicating, is extracted from the bitstream (S1845).
  • mv_resolution_scale may be information indicating a value obtained by dividing an alternative resolution value by the motion vector resolution of the current CU.
  • step S1846 of the fourth embodiment the motion vector resolution decoder 1110 calculates a motion vector resolution value of the current CU from the mv_resolution_scale value.
  • the motion vector resolution decoder 1110 decodes the motion vector resolution corresponding to the mv_resolution_scale value as the motion vector resolution value of the current CU when the current CU is the first CU in the coding order in the higher level image unit. .
  • the motion vector resolution decoder 1110 may determine the motion vector resolution of the CU encoded immediately before the encoding of the current CU in the encoding order. The result of multiplying the value by the ratio factor of the current CU is calculated as a motion vector resolution value of the current CU. In this case, since the alternative resolution is not necessary to calculate the motion vector resolution of the current CU, the motion vector resolution decoder 1110 may omit the operation of extracting the alternative_mv_resolution from the bitstream.
  • the motion vector resolution decoder 1110 multiplies the result of multiplying the mv_resolution_scale value by the alternative resolution value in the current CU within the higher level image unit. It may be implemented to decode as a motion vector resolution value of.
  • the motion vector resolution decoder 1110 may use the mv_resolution_scale value when the current CU is the first CU in the encoding order of the higher level image unit. Multiplying by an alternative resolution value to decode as a motion vector resolution value of the current CU, and when the current CU is a CU after the first CU in the encoding order of the higher level image unit, the motion vector resolution decoder 1110 determines the encoding order.
  • a result of multiplying a motion vector resolution value of a CU encoded immediately before encoding of the current CU by a mv_resolution_scale value extracted corresponding to the current CU may be calculated as a motion vector resolution value of the current CU.
  • Adaptive_MV_resolution_enabled_flag and alternative_mv_resolution exist in a Slice (Tile) header (or SPS, PPS, CTU), and are present in a header of a CU to be encoded. If mv_resolution_flag and mv_resolution_scale information are present, the motion vector resolution decoder 1110 determines whether or not to apply the adaptive motion vector resolution determination method of the present invention in units of Slice (Tile) (or image sequence, picture, CTU). The motion vector resolution of the current CU may be adjusted using the mv_resolution_scale value while determining the resolution and adaptively applying the motion vector resolution in units of blocks within a slice (Tile) (or image sequence, picture, or CTU) unit. .
  • the mv_resolution_scale value is expressed to have a value corresponding to the motion vector resolution value of the current CU.
  • the mv_resolution_scale value is expressed as a multiple between the motion vector resolution value of the CU encoded immediately before the current CU and the motion vector resolution value of the current CU.
  • Adaptive_MV_resolution_enabled_flag of the slice header is on, the default motion vector resolution is 1 / 4-pixel, and mv_resolution_flag, the header information of the current CU, is off, the motion vector resolution of the current CU is not extracted without extracting the mv_resolution_scale information of the current CU. Is determined by 1 / 4-pixel corresponding to the default motion vector resolution.
  • mv_resolution_flag of the current CU is on and the current CU is the first encoded CU
  • the motion vector resolution of the current CU is 4-pixel corresponding to 4, which is the mv_resolution_scale value.
  • the motion vector resolution of the current CU is the mv_resolution_scale value of 1 pixel at 4-pixel of the previous CU's motion vector resolution. 2-pixel is calculated by multiplying by 2.
  • the mv_resolution_scale value of each CU may be expressed as a multiple value between the alternative resolution alternative_mv_resolution value included in the Slice (Tile) header (or SPS, PPS, CTU) and the motion vector resolution of the current block.
  • the motion vector resolution of the current CU is determined to be 1 / 4-pixel corresponding to the default motion vector resolution.
  • the motion vector resolution of the current CU is 4-pixel, which is a value obtained by multiplying 1 by the mv_resolution_scale value by 4-pixel, which is an alternative resolution alternative_mv_resolution value. If the mv_resolution_flag of the next CU is on and the mv_resolution_scale value is 1/2, the motion vector resolution of the corresponding CU is 2-pixel, which is the result of multiplying 4-pixel, which is an alternative resolution, by 1/2 of the mv_resolution_scale value.
  • the mv_resolution_scale value of each CU is expressed as a multiple of the alternative resolution mv_resolution value described in the Slice (Tile) header (or SPS, PPS) and the motion vector resolution of the current CU, or immediately before the current CU. It is expressed as a multiple value between the motion vector resolution value of the encoded CU and the motion vector resolution value of the current CU. That is, when the current CU is the first CU in the encoding order, the mv_resolution_scale value of the current CU is a multiple of the value of the alternative_mv_resolution value described in the Slice (Tile) header (or SPS, PPS) and the motion vector resolution value of the current CU.
  • the mv_resolution_scale value of the current CU is expressed as a multiple between the motion vector resolution value of the CU previously encoded and the motion vector resolution value of the current CU. do.
  • the motion vector resolution of the current CU is mv_resolution_scale information. Since the motion vector resolution of the current CU is determined to be 1 / 4-pixel corresponding to the default motion vector resolution, the motion vector of the current CU is expressed in 1 / 4-pixel units corresponding to the default motion vector resolution.
  • the motion vector resolution of the current CU is 4-pixel, which is a value obtained by multiplying 1 by the mv_resolution_scale value by 4 pixels, which is an alternative_mv_resolution value of the slice header. If the current CU is the next CU of the first CU, if the mv_resolution_flag of the current CU is on and the mv_resolution_scale value of the current CU is 1/2, the motion vector resolution of the current CU is set to 4 pixels, the motion vector resolution value of the immediately encoded CU. It becomes 2-pixel which is multiplied by 1/2, which is the mv_resolution_scale value of the current CU.
  • FIG. 19 is a flowchart illustrating a case in which some steps are added to the flowchart of FIG. 18.
  • operation S1840 includes steps S1841, S1842_1, S1842_2, S1843, S1844, S1845, S1846, S1847, and S1848.
  • operation S1850 in FIG. 19 includes steps S1851, S1852, S1853, and S1855.
  • steps S1242_1 and S1242_2 are added instead of step S1242 of FIG. 18 in operation S1240, and step S1854 of FIG. 18 is excluded in operation S1250.
  • step S1843 of FIG. 19 are the same as operations of step S1843 of FIG. 18.
  • the image decoder 1120 decodes the information mvd about the differential motion vector from the bitstream (S1842_1).
  • the motion vector resolution decoder 1110 After decoding the differential motion vector in step S1842_1, the motion vector resolution decoder 1110 checks whether the differential motion vector is not 0 and whether Adaptive_MV_resolution_enabled_flag is ON (S1842_2). If it is confirmed in step S1842_2 that the differential motion vector is not 0 and Adaptive_MV_resolution_enabled_flag is ON, the flow proceeds to step S1843. If the differential motion vector is 0 or the Adaptive_MV_resolution_enabled_flag is not ON, the flow proceeds to step S1848.
  • step S1851 may be executed before step S1842_1 or may be executed between step S1842_1 and S1842_2.
  • the motion vector resolution decoder 1110 extracts Adaptive_MV_resolution_enabled_flag from the bitstream, but according to the embodiment, the motion vector resolution decoder 1110 in the image decoding apparatus 1100 may be a bit. Extracting the Adaptive_MV_resolution_enabled_flag from the stream may be omitted. In this case, the motion vector resolution decoder 1110 may perform the same operation as that performed when the Adaptive_MV_resolution_enabled_flag is ON, or may perform the same operation as when the Adaptive_MV_resolution_enabled_flag is OFF. In this case, the image encoding apparatus 400 also omits an operation of encoding Adaptive_MV_resolution_enabled_flag corresponding to the operation of the image decoding apparatus 1100.
  • the unit for determining the motion vector resolution by parsing the mv_resolution_flag is not limited to a CU unit, and determining one of the default motion vector resolution or the alternative resolution as the motion vector resolution by parsing the mv_resolution_flag.
  • the unit may be a CTU unit.
  • all CUs included in the CTU may have the same motion vector resolution value.
  • the higher level image unit of the CTU unit may be one of an image sequence, a picture, or a slice.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 발명은, 영상을 부호화하는 방법에 있어서, 현재블록의 움직임 벡터 해상도를 결정하는 단계; 상기 움직임 벡터 해상도에 따라 상기 현재블록의 움직임 벡터를 결정하는 단계; 상기 움직임 벡터를 이용하여 상기 현재블록을 예측하고 부호화하는 단계; 및 상기 움직임 벡터 해상도에 관한 정보를 부호화하는 단계를 포함하는 것을 특징으로 하는 영상 부호화 방법을 제공한다.

Description

영상 부호화 또는 복호화를 위한 장치 및 방법
본 발명은 영상을 효율적으로 부호화하기 위한 영상 부호화 또는 복호화에 관한 것이다.
이 부분에 기술된 내용은 단순히 본 실시예에 대한 배경 정보를 제공할 뿐 종래기술을 구성하는 것은 아니다.
동영상 데이터는 음성 데이터나 정지 영상 데이터 등에 비하여 데이터량이 많기 때문에, 압축을 위한 처리 없이 그 자체를 저장하거나 전송하기 위해서는 메모리를 포함하여 많은 하드웨어 자원을 필요로 한다. 따라서, 통상적으로 동영상 데이터를 저장하거나 전송할 때에는 부호화기를 사용하여 동영상 데이터를 압축하여 저장하거나 전송하며, 복호화기에서는 압축된 동영상 데이터를 수신하여 압축을 해제하고 재생한다. 이러한 동영상 압축 기술로는 H.264/AVC를 비롯하여, H.264/AVC 약 40% 정도의 부호화 효율을 향상시킨 2013년 초에 제정된 HEVC(High Efficiency Video Coding)가 존재한다.
부호화 또는 복호화를 위하여 예측하는 방법 중에서 하나인 인터 예측 부호화 시에는, 현재 블록을 예측한 후 생성된 잔차(residual) 블록을 부호화한 정보와 현재 블록을 예측하는 데에 사용된 움직임 정보를 복호화 장치로 시그널링(signaling) 한다. 여기서 움직임 정보는, 현재블록을 예측하기 위해 사용된 참조 픽처에 대한 정보 및 움직임벡터에 대한 정보를 포함하며, 기존 HEVC 표준의 경우 움직임 벡터를 1/4-pixel 단위로 표현한다.
하지만, 영상의 크기 및 해상도, 프레임율(Frame rate)이 점차 증가하고 있고, 이에 따라 부호화해야 하는 데이터량도 증가하고 있다. 따라서, 기존의 압축 기술보다 더 부호화 효율이 좋은 압축 기술이 요구된다.
본 발명은 영상 및 블록 사이즈의 변화 등에 따른 영상의 특성에 따라 움직임벡터를 획득하는 해상도를 조절하여 효율적으로 영상을 부호화하기 위한 영상 부호화 또는 복호화 기술을 제공한다.
본 발명의 일 측면은, 영상을 부호화하는 방법에 있어서, 현재블록의 움직임 벡터 해상도를 결정하는 단계; 상기 현재블록의 움직임 벡터 해상도에 따라 상기 현재블록의 움직임 벡터를 결정하는 단계; 상기 현재블록의 움직임 벡터를 이용하여 상기 현재블록을 예측하고 부호화하는 단계; 및 상기 현재블록의 움직임 벡터 해상도에 관한 정보를 부호화하는 단계를 포함하는 것을 특징으로 하는 영상 부호화 방법을 제공한다.
본 발명의 다른 측면은, 적응적으로 현재블록의 움직임 벡터 해상도를 결정하여 상기 현재블록을 복호화하는 방법에 있어서, 상기 현재블록의 움직임 벡터 해상도에 관한 정보를 비트스트림으로부터 추출하고 상기 현재블록의 움직임 벡터 해상도에 관한 정보에 기초하여 상기 현재블록의 움직임 벡터 해상도를 결정하는 단계; 및 상기 현재블록의 움직임 벡터 해상도에 따라 결정되는 상기 현재블록의 움직임 벡터를 이용하여 상기 현재블록을 예측하고 복호화하는 단계를 포함하는 것을 특징으로 하는 영상 복호화 방법을 제공한다.
본 발명의 또 다른 측면은, 적응적으로 현재블록의 움직임 벡터 해상도를 결정하여 상기 현재블록을 복호화하는 장치에 있어서, 상기 현재블록의 움직임 벡터 해상도에 관한 정보를 비트스트림으로부터 추출하고 상기 현재블록의 움직임 벡터 해상도에 관한 정보에 기초하여 상기 현재블록의 움직임 벡터 해상도를 결정하는 움직임 벡터 해상도 복호화기; 및 상기 현재블록의 움직임 벡터 해상도에 따라 결정되는 상기 현재블록의 움직임 벡터를 이용하여 상기 현재블록을 예측하고 복호화하는 영상 복호화기를 포함하는 것을 특징으로 하는 영상 복호화 장치를 제공한다.
도 1은 일반적인 영상 부호화 장치에 대한 블록도,
도 2는 QTBT(QuadTree plus BinaryTree) 구조를 이용한 블록 분할의 예시도,
도 3은 현재블록의 주변블록에 대한 예시도,
도 4는 본 발명의 일 실시예에 따른 영상 부호화 장치에 대한 블록도,
도 5는 참조 픽처를 보간하는 과정 및 참조픽처의 해상도를 설명하기 위한 예시도,
도 6은 두 프레임 사이에서 화면 간 움직임 정도를 비교하기 위한 도면,
도 7은 일 실시예에 따른 해상도 결정기(410)를 예시한 도면,
도 8은 현재 CU의 움직임 벡터 해상도 정보를 해상도 차분값으로 부호화하는 경우의 해상도 부호화기(430)를 예시한 도면,
도 9는 현재 CU의 움직임 벡터를 해상도 차분값 대신 해상도 비율 인자로 표현하는 해상도 부호화기(430)를 예시한 도면,
도 10은 일반적인 영상 복호화 장치를 간략히 도시한 블록도,
도 11은 본 발명의 일 실시예에 따른 영상 복호화 장치(1100)를 도시한 도면,
도 12는 본 발명의 제1실시예에 따른 영상 복호화 장치(1100)에서 영상을 복호화하는 방법을 도시한 흐름도,
도 13은 적응적으로 해상도를 결정하는 한 예를 나타낸 도면,
도 14는 도 12의 흐름도에서 일부 단계가 추가된 경우를 도시한 흐름도,
도 15는 본 발명의 제2실시예에 따른 영상 복호화 장치(1100)에서 영상을 복호화하는 방법을 도시한 흐름도,
도 16은 적응적으로 해상도를 결정하는 다른 예를 나타낸 도면,
도 17은 도 15의 흐름도에서 일부 단계가 추가된 경우를 도시한 흐름도,
도 18은 본 발명의 제3실시예에 따른 영상 복호화 장치(1100)에서 영상을 복호화하는 방법을 도시한 흐름도,
도 19는 도 18의 흐름도에서 일부 단계가 추가된 경우를 도시한 흐름도이다.
이하, 본 발명의 일부 실시예들을 예시적인 도면을 통해 상세하게 설명한다. 각 도면의 구성 요소들에 식별 부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.
도 1은 일반적인 영상 부호화 장치를 간략하게 도시한 블록도이다.
영상 부호화 장치(100)는 블록 분할부(110), 예측부(120), 감산기(130), 변환부(140), 양자화부(145), 부호화부(150), 역양자화부(160), 역변환부(165), 가산기(170), 필터부(180) 및 메모리(190)를 포함한다. 영상 부호화 장치(100)의 각 구성요소는 하드웨어 칩으로 구현될 수 있으며, 또는 소프트웨어로 구현되고 하나 이상의 마이크로프로세서가 각 구성요소에 대응하는 소프트웨어의 기능을 실행하도록 구현될 수도 있다.
블록 분할부(110)는 영상을 구성하는 각 픽처(picture)를 복수의 CTU(Coding Tree Unit)으로 분할한 이후에, CTU를 트리 구조(tree structure)를 이용하여 반복적으로(recursively) 분할한다. 트리 구조에서의 리프 노드(leaf node)가 부호화의 기본 단위인 CU (coding unit)가 된다. 트리 구조로는 상위 노드가 네 개의 하위 노드로 분할하는 쿼드트리(QuadTree, QT) 구조가 사용되거나, 또는 QT 구조 및 상위 노드가 두 개의 하위 노드로 분할하는 바이너리트리(BinaryTree, BT) 구조를 혼용한 QTBT (QuadTree plus BinaryTree) 구조가 사용될 수 있다.
QTBT (QuadTree plus BinaryTree) 구조에서, CTU는 먼저 QT 구조로 분할된다. 이후, QT의 리프 노드들은 BT에 의해 추가로 더 분할될 수 있다. 블록 분할부(110)가 QTBT 구조에 의해 CTU를 분할하여 생성하는 분할 정보는 부호화부(150)에 의해 부호화되어 복호화 장치로 전달된다.
QT에서는 해당 노드의 블록이 분할 여부를 지시하는 제1 플래그(QT 분할 플래그, QT_split_flag)가 부호화된다. 제1 플래그가 1이면 해당 노드의 블록이 동일 크기의 네 개의 블록으로 분할되고, 0이면 해당 노드는 더 이상 QT에 의해 분할되지 않는다.
BT에서는 해당 노드의 블록의 분할 여부를 지시하는 제2 플래그(BT 분할 플래그, BT_split_flag)가 부호화된다. BT 에서는 복수의 분할 타입이 존재할 수 있다. 예컨대, 해당 노드의 블록을 동일 크기의 두 개 블록으로 가로로 분할하는 타입과 세로로 분할하는 타입 두 가지가 존재할 수 있다. 또는, 해당 노드의 블록을 서로 비대칭 형태의 두 개의 블록으로 분할하는 타입이 추가로 더 존재할 수도 있다. 비대칭 형태로는 해당 노드의 블록을 1:3의 크기 비율을 가지는 두 개의 직사각형 블록으로 분할하는 형태를 포함할 수 있고, 또는 해당 노드의 블록을 대각선 방향으로 분할하는 형태를 포함할 수도 있다. 이렇게 BT가 복수의 분할 타입을 가지는 경우에는, 블록이 분할됨을 의미하는 제2 플래그가 부호화되면, 해당 블록의 분할 타입을 지시하는 분할 타입 정보가 추가로 부호화된다.
도 2는 QTBT 구조를 이용한 블록 분할의 예시도이다. 도 2의 (a)는 QTBT 구조에 의해 블록이 분할되는 예시이고, (b)는 이를 트리구조로 표현한 것이다. 도 2에서 실선은 QT 구조에 의한 분할을, 점선은 BT 구조에 의한 분할을 나타낸다. 또한, 도 2 (b)에서 layer 표기와 관련하여, 괄호가 없는 것은 QT의 레이어를, 괄호가 있는 것은 BT의 레이어를 나타낸다. 점선으로 표현된 BT 구조에서 숫자는 분할 타입 정보를 나타낸다.
도 2에서, QT의 최상위 레이어인 CTU는 layer 1의 네 개의 노드로 분할된다. 이에 따라 블록 분할부(110)는 CTU가 분할됨을 지시하는 QT 분할 플래그(QT_split_flag = 1)를 생성한다. layer 1의 첫 번째 노드에 해당하는 블록은 더 이상 QT에 의해 분할되지 않다. 따라서, 블록 분할부(110)는 QT_split_flag = 0을 생성한다.
이후, QT의 layer 1의 첫 번째 노드에 해당하는 블록은 BT로 진행한다. 본 실시예에서는, BT가 해당 노드의 블록을 동일 크기의 두 개 블록으로 가로로 분할하는 타입과 세로로 분할하는 타입 두 가지가 존재하는 것으로 설명한다. QT의 layer 1의 첫 번째 노드는 BT의 루트 노드(root node, (layer 0))가 된다. BT의 루트 노드에 해당하는 블록은 (layer 1)의 블록으로 더 분할되므로, 블록 분할부(110)는 BT에 의해 분할됨을 지시하는 BT 분할 플래그(BT_split_flag) = 1을 생성한다. 이후, 해당 블록이 가로로 분할되는지 아니면 세로로 분할되는지 여부를 지시하는 분할 타입 정보를 생성한다. 도 2에서 BT의 루트 노드에 해당하는 블록은 세로로 분할되므로 세로 분할을 지시하는 1이 분할 타입 정보로서 생성된다. 루트 노드로부터 분할된 (layer 1)의 블록 중 첫 번째 블록은 추가로 더 분할되고 분할 타입은 세로이므로, BT_split_flag = 1 및 분할 타입 정보 1을 생성한다. 반면, BT의 루트 노드로부터 분할된 (layer 1)의 두 번째 블록은 더 이상 분할되지 않으므로 BT_split_flag = 0을 생성한다.
한편, QTBT 구조에 의한 블록 분할에 대한 정보를 효율적으로 복호화 장치로 시그널링하기 위해, 다음의 정보가 추가로 부호화될 수 있다. 이 정보들은 영상의 헤더 정보로서 부호화되는데, 예컨대 SPS (Sequence Parameter Set)이나 PPS (Picture Parameter Set)로 부호화될 수 있다.
- CTU size: QTBT의 최상위 레이어, 즉, 루트 노드의 블록 크기
- MinQTSize: QT에서 허용되는 리프 노드의 최소 블록 크기
- MaxBTSize: BT에서 허용되는 루트 노드의 최대 블록 크기
- MaxBTDepth: BT에서 허용되는 최대 심도(Depth)
- MinBTSize: BT에서 허용되는 리프 노드의 최소 블록 크기
QT에서 MinQTSize 과 동일한 크기를 가지는 블록은 더 이상 분할되지 않으며, 따라서 해당 블록에 대응하는 QT에 관한 분할 정보(제1 플래그)는 부호화되지 않는다. 또한, QT에서 MaxBTSize보다 큰 크기를 가지는 블록은 BT가 존재하지 않는다. 따라서, 해당 블록에 대응하는 BT에 관한 분할 정보(제2 플래그, 분할 타입 정보)는 부호화되지 않는다. 또한, BT의 해당 노드의 심도(depth)가 MaxBTDepth에 도달하면, 해당 노드의 블록은 더 이상 분할되지 않으며 해당 노드의 BT에 관한 분할 정보(제2 플래그, 분할 타입 정보) 또한 부호화되지 않는다. 또한, BT에서 MinBTSize와 동일한 크기를 가지는 블록은 더 이상 분할되지 않으며 BT에 관한 분할 정보(제2 플래그, 분할 타입 정보) 또한 부호화되지 않는다. 이렇게, QT와 BT의 루프나 리프 노드가 가질 수 있는 최대 또는 최소 블록 크기를 SPS (Sequence Parameter Set)이나 PPS (Picture Parameter Set) 등의 하이 레벨(high level)에서 정의함으로써, CTU의 분할 여부나 분할 타입을 지시하는 정보들에 대한 부호화량을 줄일 수 있다.
한편, CTU의 휘도(luma) 성분과 색차(chroma) 성분은 동일한 QTBT 구조로 분할될 수 있다. 그러나, 본 발명이 이에 한정되는 것은 아니며 휘도 성분과 색차 성분이 각각 별개의 QTBT 구조를 사용하여 분할될 수 있다. 예컨대, I (Intra) 슬라이스의 경우에는 루마(luma) 성분과 chroma 성분이 서로 다른 QTBT 구조로 분할될 수도 있다.
이하에서는, 부호화 또는 복호화하고자 하는 CU에 해당하는 블록을 '현재블록'이라 칭한다.
예측부(120)는 현재블록을 예측하여 예측블록을 생성한다. 예측부(120)는 인트라 예측부(122)와 인터 예측부(124)를 포함한다.
인트라 예측부(122)는 현재블록이 포함된 현재 픽처 내에서 현재블록의 주변에 위치한 픽셀(참조 픽셀)들을 이용하여 현재블록 내의 픽셀들을 예측한다. 예측 방향에 따라 복수의 인트라 예측모드가 존재하며, 각 예측모드에 따라 사용할 주변 픽셀과 연산식이 다르게 정의된다.
인터 예측부(124)는 현재 픽처보다 먼저 부호화 및 복호화된 참조 픽처 내에서 현재블록과 가장 유사한 블록을 탐색하고, 그 탐색된 블록을 이용하여 현재블록에 대한 예측블록을 생성한다. 그리고, 현재 픽처 내의 현재블록과 참조 픽처 내의 예측블록 간의 변위(displacement)에 해당하는 움직임벡터(motion vector)를 생성한다. 현재블록을 예측하기 위해 사용된 참조 픽처에 대한 정보 및 움직임벡터에 대한 정보를 포함하는 움직임 정보는 부호화부(150)에 의해 부호화되어 mv_resolution_scale 로 전달된다.
움직임 정보를 부호화하는 데에 소요되는 비트량을 최소화하기 위해 다양한 방법이 사용될 수 있다.
현재블록의 참조 픽처와 움직임벡터가 주변블록의 참조 픽처 및 움직임벡터와 동일한 경우에는 그 주변블록을 식별할 수 있는 정보를 부호화함으로써, 현재블록의 움직임 정보를 복호화 장치로 전달할 수 있다. 이러한 방법을 '머지 모드 (merge mode)'라 한다.
머지 모드에서, 인터 예측부(124)는 현재블록의 주변블록들로부터 기 결정된 개수의 머지 후보블록(이하, '머지 후보'라 함)들을 선택한다.
머지 후보를 유도하기 위한 주변블록으로는, 도 3에 도시된 바와 같이, 현재 픽처 내에서 현재블록에 인접한 좌측블록(L), 상단블록(A), 우상단블록(AR), 좌하단블록(BL), 좌상단블록(AL) 중에서 전부 또는 일부가 사용될 수 있다. 또한, 현재블록이 위치한 현재 픽처가 아닌 참조 픽처(현재블록을 예측하기 위해 사용된 참조 픽처와 동일할 수도 있고 다를 수도 있음) 내에 위치한 블록이 머지 후보로서 사용될 수도 있다. 예컨대, 참조 픽처 내에서 현재블록과 동일 위치에 있는 블록(co-located block) 또는 그 동일 위치의 블록에 인접한 블록들이 머지 후보로서 추가로 더 사용될 수 있다.
인터 예측부(124)는 이러한 주변블록들을 이용하여 기 결정된 개수의 머지 후보를 포함하는 머지 리스트를 구성한다. 머지 리스트에 포함된 머지 후보들 중에서 현재블록의 움직임정보로서 사용할 머지 후보를 선택하고 선택된 후보를 식별하기 위한 머지 인덱스 정보를 생성한다. 생성된 머지 인덱스 정보는 부호화부(150)에 의해 부호화되어 복호화 장치로 전달된다.
움직임 정보를 부호화하는 또 다른 방법은 차분 움직임벡터를 부호화하는 것이다.
이 방법에서, 인터 예측부(124)는 현재블록의 주변블록들을 이용하여 현재블록의 움직임벡터에 대한 예측 움직임벡터 후보들을 유도한다. 예측 움직임벡터 후보들을 유도하기 위해 사용되는 주변블록으로는, 도 3에 도시된 현재 픽처 내에서 현재블록에 인접한 좌측블록(L), 상단블록(A), 우상단블록(AR), 좌하단블록(BL), 좌상단블록(AL) 중에서 전부 또는 일부가 사용될 수 있다. 또한, 현재블록이 위치한 현재 픽처가 아닌 참조 픽처(현재블록을 예측하기 위해 사용된 참조 픽처와 동일할 수도 있고 다를 수도 있음) 내에 위치한 블록이 예측 움직임벡터 후보들을 유도하기 위해 사용되는 주변블록으로서 사용될 수도 있다. 예컨대, 참조 픽처 내에서 현재블록과 동일 위치에 있는 블록(co-located block) 또는 그 동일 위치의 블록에 인접한 블록들이 사용될 수 있다.
인터 예측부(124)는 이 주변블록들의 움직임벡터를 이용하여 예측 움직임벡터 후보들을 유도하고, 예측 움직임벡터 후보들을 이용하여 현재블록의 움직임벡터에 대한 예측 움직임벡터를 결정한다. 그리고, 현재블록의 움직임벡터로부터 예측 움직임벡터를 감산하여 차분 움직임벡터를 산출한다.
예측 움직임벡터는 예측 움직임벡터 후보들에 기 정의된 함수(예컨대, 중앙값, 평균값 연산 등)를 적용하여 구할 수 있다. 이 경우, 영상 복호화 장치도 기 정의된 함수를 알고 있다. 또한, 예측 움직임벡터 후보를 유도하기 위해 사용하는 주변블록은 이미 부호화 및 복호화가 완료된 블록이므로 영상 복호화 장치도 그 주변블록의 움직임벡터로 이미 알고 있다. 그러므로 영상 부호화 장치(100)는 예측 움직임벡터 후보를 식별하기 위한 정보를 부호화할 필요가 없다. 따라서, 이 경우에는 차분 움직임벡터에 대한 정보와 현재블록을 예측하기 위해 사용한 참조 픽처에 대한 정보가 부호화된다.
한편, 예측 움직임벡터는 예측 움직임벡터 후보들 중 어느 하나를 선택하는 방식으로 결정될 수도 있다. 이 경우에는 차분 움직임벡터에 대한 정보 및 현재블록을 예측하기 위해 사용한 참조 픽처에 대한 정보와 함께, 선택된 예측 움직임벡터 후보를 식별하기 위한 정보가 추가로 부호화된다.
감산기(130)는 현재블록으로부터 인트라 예측부(122) 또는 인터 예측부(124)에 의해 생성된 예측블록을 감산하여 잔차 블록을 생성한다.
변환부(140)는 공간 영역의 픽셀 값들을 가지는 잔차 블록 내의 잔차 신호를 주파수 도메인의 변환 계수로 변환한다. 변환부(140)는 잔차 블록 내의 잔차 신호들을 현재블록의 크기를 변환 단위로 사용하여 변환할 수 있으며, 또는 잔차 블록을 더 작은 복수의 서브블록을 분할하고 서브블록 크기의 변환 단위로 잔차 신호들을 변환할 수도 있다. 잔차 블록을 더 작은 서브블록으로 분할하는 방법은 다양하게 존재할 수 있다. 예컨대, 기정의된 동일한 크기의 서브블록으로 분할할 수도 있으며, 또는 잔차 블록을 루트 노드로 하는 QT(quadtree) 방식의 분할을 사용할 수도 있다.
양자화부(145)는 변환부(140)로부터 출력되는 변환 계수들을 양자화하고, 양자화된 변환 계수들을 부호화부(150)로 출력한다.
부호화부(150)는 양자화된 변환 계수들을 CABAC 등의 부호화 방식을 사용하여 부호화하여 비트스트림을 생성한다. 또한, 부호화부(150)는 블록 분할과 관련된 CTU size, MinQTSize, MaxBTSize, MaxBTDepth, MinBTSize, QT 분할 플래그, BT 분할 플래그, 분할 타입 등의 정보를 부호화하여, 복호화 장치가 부호화 장치와 동일하게 블록을 분할할 수 있도록 한다.
부호화부(150)는 현재블록이 인트라 예측에 의해 부호화되었는지 아니면 인터 예측에 의해 부호화되었는지 여부를 지시하는 예측 타입에 대한 정보를 부호화하고, 예측 타입에 따라 인트라 예측정보 또는 인터 예측정보를 부호화한다.
한편, 현재블록이 인터 예측된 경우, 부호화부(150)는 인터 예측정보에 대한 신택스 요소를 부호화한다. 인터 예측정보에 대한 신택스 요소는 다음을 포함한다.
(1) 현재블록의 움직임정보가 머지 모드로 부호화되는지 아니면 차분 움직임벡터를 부호화하는 모드로 부호화되는지 여부를 지시하는 모드 정보
(2) 움직임정보에 대한 신택스 요소
움직임정보가 머지 모드에 의해 부호화되는 경우, 부호화부(150)는 머지 후보들 중 어느 후보가 현재블록의 움직임정보를 추출하기 위한 후보로서 선택되는지를 지시하는 머지 인덱스 정보를 움직임정보에 대한 신택스 요소로 부호화한다.
반면, 움직임정보가 차분 움직임벡터를 부호화하는 모드에 의해 부호화되는 경우, 차분 움직임벡터에 대한 정보 및 참조 픽처에 대한 정보를 움직임정보에 대한 신택스 요소로 부호화한다. 만약, 예측 움직임벡터가 복수의 예측 움직임벡터 후보들 중 어느 하나의 후보를 선택하는 방식으로 결정되는 경우에는, 움직임정보에 대한 신택스 요소는 그 선택된 후보를 식별하기 위한 예측 움직임벡터 식별 정보를 추가로 더 포함한다.
역양자화부(160)는 양자화부(145)로부터 출력되는 양자화된 변환 계수들을 역양자화하여 변환 계수들을 생성한다. 역변환부(165)는 역양자화부(160)로부터 출력되는 변환 계수들을 주파수 도메인으로부터 공간 도메인으로 변환하여 잔차블록을 복원한다.
가산부(170)는 복원된 잔차블록과 예측부(120)에 의해 생성된 예측블록을 가산하여 현재블록을 복원한다. 복원된 현재블록 내의 픽셀들은 다음 순서의 블록을 인트라 예측할 때 참조 픽셀로서 사용된다.
필터부(180)는 블록 단위의 부호화/복호화로 인해 발생하는 블록킹 현상(blocking artifact)을 제거하기 위해 복원된 블록 간의 경계를 디블록킹 필터링하고 메모리(190)에 저장한다. 한 픽처 내의 모든 블록들이 복원되면, 복원된 픽처는 이후에 부호화하고자 하는 픽처 내의 블록을 인터 예측하기 위한 참조 픽처로 사용된다.
참고로, 영상 부호화 장치는 스킵 모드(Skip Mode)를 사용하여 현재블록을 부호화할 수도 있다. 스킵 모드에서는, 현재블록의 움직임정보만이 부호화되고 잔차블록에 대한 정보 등 현재블록에 대한 어떠한 다른 정보도 부호화되지 않는다. 현재블록의 움직임정보로서는 전술한 머지 인덱스 정보가 사용될 수 있다. 영상 복호화 장치는, 현재 블록이 스킵 모드로 부호화된 경우, 비트스트림으로부터 복호화된 머지 인덱스 정보에 의해 지시되는 머지 후보의 움직임정보를 현재블록의 움직임정보로 설정한다. 그리고 현재블록의 움직임정보에 의해 예측된 예측블록을 현재블록으로서 복원한다.
스킵 모드는 현재블록의 움직임정보 이외에 어떠한 다른 정보도 부호화되지 않는다는 점에서 현재블록의 움직임정보 이외에 잔차블록에 대한 정보 등도 부호화하는 머지 모드와 구분된다. 그러나, 스킵 모드와 머지 모드에서 현재블록의 움직임정보를 부호화하는 방법은 동일하므로, 이하에서 머지 모드에 대해 설명하는 모든 내용은 스킵 모드에도 동일하게 적용될 수 있다.
도 4는 본 발명의 일 실시예에 따른 영상 부호화 장치(400)를 도시한 도면이다.
본 발명의 일 실시예에 따른 영상 부호화 장치(400)는 해상도 결정기(410), 영상 부호화기(420) 및 해상도 부호화기(430)를 포함한다.
해상도 결정기(410)는 현재 CU의 움직임을 추정하기 위한 움직임 벡터 해상도를 결정한다. 움직임 벡터 해상도는 움직임 벡터를 결정하는 최소 단위이다. 또한, 움직임 벡터 해상도는 현재 CU의 움직임 보상을 위한 참조 픽처의 해상도, 즉, 참조 픽처를 어느 픽셀까지 보간할 것인지를 의미할 수 있다. 예컨대, 움직임벡터 해상도가 1/4 pixel이라고 하면, 참조 픽처는 1/4 pixel 단위까지 보간되며 움직임벡터는 1/4 픽셀 단위까지 측정된다. 여기서, 움직임 벡터를 결정하는 최소 단위는 1/4 pixel, 1/2 pixel과 같은 분수 화소(fractional pixel) 단위이거나, 1 pixel, 2 pixel, 3 pixel, 4 pixel과 같은 정수 화소(integer pixel) 단위가 될 수 있다.
영상 부호화기(420)는, 결정된 움직임 벡터 해상도에 따라 블록 단위(즉, CU 단위)로 움직임을 추정하여 CU의 움직임 벡터를 결정하고 결정된 움직임 벡터를 이용하여 CU를 예측하고 부호화한다.
해상도 부호화기(430)는 CU를 예측하는 데에 사용된 움직임 벡터의 움직임 벡터 해상도에 관한 정보를 부호화한다.
여기서, 영상 부호화기(420)는 도 1을 통해 전술한 영상 부호화 장치(100)로서 구현될 수 있다.
또한, 해상도 결정기(410)의 기능은 전술한 영상 부호화 장치(100) 내의 예측부(120)의 기능에 포함되어 예측부(120)와 일체로 구현될 수도 있다.
또한, 해상도 부호화기(430)의 기능은 전술한 영상 부호화 장치(100) 내의 부호화부(150)의 기능에 포함되어 부호화기(150)와 일체로 구현될 수도 있다.
도 5는 인터 예측부(124)에서 참조 픽처를 보간하고 움직임 추정을 하는 과정과 참조픽처의 해상도를 설명하기 위한 예시도이다.
도 5에는 메모리(190)에 저장된 참조 픽처의 화소들과, 참조 픽처의 화소들을 부화소로 보간한 화소들을 나타내었다. 도 5에 도시된 바와 같이, 참조 픽처의 이미 복원된 정수 화소(A1~F6)을 보간 필터(Interpolation Filter)로 필터링하면, 예컨대 부화소 a~s가 생성될 수 있으며, 이와 같이 보간을 하면 움직임 추정(Motion Estimation) 및 움직임 보상을 위한 참조 픽처의 해상도가 정수화소 해상도보다 2배, 4배 또는 그 이상 높아질 수 있다.
참고로, 움직임 추정은 보간된 참조 픽처에서 현재 CU와 가장 유사한 부분을 찾아서 해당 부분의 블록과 해당 블록을 가리키는 움직임 벡터를 출력하는 과정이며, 이 과정에서 생성된 움직임 벡터는 부호화부(150)에서 부호화된다.
움직임 추정 및 움직임 보상 시에, 움직임이 미세한 영상 영역을 예측하는 경우 분수 화소 (1/2-pixel, 1/4-pixel, 1/8-pixel, 1/6-pixel 등) 단위로 움직임 벡터가 표현되고, 움직임이 큰 영역을 예측하는 경우 하나 이상의 정수 화소 단위(1-pixel 단위, 2-pixel 단위, 3-pixel 단위, 4-pixel 단위 등)로 움직임 벡터가 표현될 수 있다.
도 6은 두 프레임 사이에서 화면 간 움직임 정도를 비교하기 위한 도면이다.
도 6에서, 참조 프레임 (reference frame) 및 현재 프레임(current frame)에 포함된 물체의 움직임을 비교하면, 도 6에서 원에 해당하는 물체는 두 프레임 사이에서 미세한 움직임을 가지므로 분수 화소 단위로 해당 물체의 움직임이 추정되고, 세모에 해당하는 물체는 두 프레임 사이에서 움직임이 비교적 크므로 정수 화소 단위로 움직임이 추정될 수 있다.
한편, 부호화 대상 CU의 인터 예측 모드가 머지 모드인 경우는 움직임 정보가 직접 시그널링 되는 것이 아니라 복수의 움직임 정보 후보 중에서 선택된 움직임 정보 후보에 해당하는 인덱스 값이 시그널링 된다. 따라서, 선택된 움직임 정보 후보의 움직임 벡터 해상도에 대한 정보가 인덱스 값과 함께 전송되지는 않는다.
반면에, 부호화 대상 CU의 인터 예측 모드가 차분 움직임 벡터를 부호화하는 모드인 경우, 차분 움직임 벡터 정보가 시그널링 되므로, 차분 움직임 벡터의 크기에 따라 차분 움직임 벡터 정보가 분수 화소 단위로 표현되는 것이 더 효과적일 수도 있고 혹은 정수 단위로 표현되는 것이 더 효과적일 수도 있다.
도 7은 일 실시예에 따른 해상도 결정기(410)를 예시한 도면이다.
일 실시예에 따른 해상도 결정기(410)는 해상도 모드 결정기(710), 대체 해상도 결정기(720) 및 적응적 해상도 결정기(730)를 포함한다. 실시예에 따라서는 해상도 모드 결정기(710), 대체 해상도 결정기(720) 및 적응적 해상도 결정기(730) 중에서 적어도 어느 하나의 구성요소가 생략된 형태로 해상도 결정기(410)가 구현될 수도 있다.
해상도 모드 결정기(710)는 적응적 움직임 벡터 해상도 모드의 활성화 여부를 결정한다. 예컨대, 복수의 CU들이 그 안에 포함되는 상위 레벨 영상 단위에 대해 움직임 벡터 해상도를 적응적으로 결정할지 여부를 선택한다. 여기서 상위 레벨 영상 단위는, 영상 시퀀스, 픽처, 슬라이스, CTU 등일 수 있다. 상위 레벨 영상 단위의 움직임 벡터 해상도를 적응적으로 결정하지 않는 것으로 선택된 경우(즉 적응적 움직임 벡터 해상도 모드가 아닌 경우)에는 상위 레벨 영상 단위 내의 모든 CU에 대해 디폴트 움직임 벡터 해상도가 적용된다. 즉, 상위 레벨 영상 단위 내의 모든 CU에 1/4 pixel 등과 같은 고정된 디폴트 움직임 벡터 해상도가 적용된다. 여기서, 디폴트 움직임 벡터 해상도는 영상 부호화 장치와 영상 복호화 장치가 공유하는 기 결정된 특정의 움직임벡터 해상도일 수 있고, 또는 영상 부호화 장치가 상위 레벨 영상 영역에서 결정하여 영상 복호화 장치로 시그널링하는 값일 수도 있다. 반면, 적응적 움직임 벡터 해상도 모드가 적용되는 것으로 결정된 경우에는, 후술하는 대체 해상도 결정기(720) 및 적응적 해상도 결정기(730)에서 인터 예측하고자 하는 CU마다 움직임 벡터 해상도를 적응적으로 결정한다.
적응적 움직임 벡터 해상도 모드가 적용되는 것으로 결정된 경우, 대체 해상도 결정기(720)는, 디폴트 움직임 벡터 해상도 이외에 대체 해상도(Alternative resolution)를 결정한다. 대체 해상도는 시퀀스, 픽처, 슬라이스, CTU 및 CU 중 어느 하나의 단위마다 결정될 수 있다. 대체 해상도는 적응적 움직임 벡터 해상도 모드가 적용되는 영상의 단위와 동일한 영상 단위마다 결정될 수 있다. 예컨대, 적응적 움직임 벡터 해상도 모드가 SPS 단위로 결정되면 대체 해상도도 SPS 단위로 결정될 수 있고, 적응적 움직임 벡터 해상도 모드가 PPS나 슬라이스 단위로 결정되면 대체 해상도도 PPS나 슬라이스 단위로 결정될 수 있다. 또는, 디폴트 움직임 벡터 해상도가 결정되는 영상의 단위보다 작은 영상 단위(예컨대 슬라이스, CTU, 또는 CU)마다 결정될 수도 있다. 예컨대, 적응적 움직임 벡터 해상도 모드가 SPS 단위로 결정되면 대체 해상도는 SPS보다 하위 레벨의 영상 단위인 PPS, 슬라이스, CTU 중 어느 하나의 단위로 결정될 수 있고, PPS 단위로 결정되면 PPS보다 하위 레벨의 영상 단위인 슬라이스, CTU 중 어느 하나의 단위로 결정될 수 있다. 또는, 대체 해상도는 부호화하고자 하는 CU 단위로 결정될 수도 있다.
대체 해상도 결정기(720)는 대체 해상도를 결정함에 있어서 복수의 움직임 벡터 해상도 후보 중에서 하나를 대체 해상도로서 선택할 수 있다.
적응적 해상도 결정기(730)는, 현재 CU의 움직임벡터 해상도를 결정한다. 예컨대, 적응적 해상도 결정기(730)는 디폴트 움직임 벡터 해상도와 대체 해상도 중 어느 하나를 현재 CU의 움직임 벡터 해상도로서 결정할 수 있다.
해상도 부호화기(430)는 해상도 결정기(410)에서 결정된 정보에 기초하여 움직임 벡터 해상도에 대한 정보를 생성하여 부호화한다. 이하에서는 디폴트 움직임 벡터 해상도와 대체 해상도 중에서 현재 CU의 움직임벡터 해상도를 결정하는 경우, 해상도 부호화기(430)가 움직임 벡터 해상도 정보를 부호화하는 방법을 제1 내지 제3실시예를 예로 들어 설명한다.
제1실시예
제1실시예는, 움직임 벡터 해상도를 디폴트 움직임 벡터 해상도와 대체 해상도 사이에서 적응적으로 결정할지 여부를 선택하는 영상 단위와 대체 해상도를 결정하는 영상 단위가 서로 같고, 그 두 영상 단위가 각각 CU 보다 큰 경우를 예시한 실시예이다.
움직임 벡터 해상도를 적응적으로 결정할지 여부가 영상 시퀀스 단위마다 해상도 모드 결정기(710)에 의해 선택되는 경우에, 해상도 부호화기(430)는 움직임 벡터 해상도를 적응적으로 결정할지 여부를 나타내는 플래그인 Adaptive_MV_resolution_enabled_flag(즉, 제1 식별정보)를 SPS(Sequence Parameter Set)에 삽입한다.
또한, 움직임 벡터 해상도를 적응적으로 결정할지 여부가 픽처 단위마다 해상도 모드 결정기(710)에 의해 선택되는 경우에, 해상도 부호화기(430)는 움직임 벡터 해상도를 적응적으로 결정할지 여부를 나타내는 플래그인 Adaptive_MV_resolution_enabled_flag를 PPS(Picture Parameter Set)에 삽입한다.
또한, 움직임 벡터 해상도를 적응적으로 결정할지 여부가 슬라이스(또는 CTU) 단위마다 해상도 모드 결정기(710)에 의해 선택되는 경우에, 해상도 부호화기(430)는 움직임 벡터 해상도를 적응적으로 결정할지 여부를 나타내는 플래그인 Adaptive_MV_resolution_enabled_flag를 슬라이스(또는 CTU) 헤더에 삽입한다.
한편, 움직임 벡터 해상도를 적응적으로 결정하는 것으로 해상도 모드 결정기(710)에 의해 선택된 경우에는 Adaptive_MV_resolution_enabled_flag=ON(예컨대, ON=1)으로 설정되고, 움직임 벡터 해상도를 적응적으로 결정하지 않는 것으로 해상도 모드 결정기(710)에 의해 선택된 경우에는 Adaptive_MV_resolution_enabled_flag=OFF(예컨대, ON=1인 경우 OFF=0)로 설정된다.
제1 실시예에서, 대체 해상도 결정기(720)가 대체 해상도를 결정하는 단위는 Adaptive_MV_resolution_enabled_flag가 설정되는 단위와 동일하다. Adaptive_MV_resolution_enabled_flag=ON인 경우, 대체 해상도 결정기(720)는 대체 해상도를 결정하고 해상도 부호화기(430)는 대체 해상도를 나타내는 정보인 alternative_mv_resolution 정보를 생성하여 Adaptive_MV_resolution_enabled_flag가 설정되는 단위와 동일한 단위마다 생성된 alternative_mv_resolution 정보를 부호화한다.
만일, 기정의된 복수의 움직임 벡터 해상도 후보 중에서 하나를 대체 해상도로서 선택하는 경우에는, 해상도 부호화기(430)는, 기정의된 복수의 움직임 벡터 해상도 후보 중에서 선택된 대체 해상도를 식별하는 정보로서 alternative_mv_resolution 정보를 생성하여 부호화한다.
적응적 해상도 결정기(730)에 의해 디폴트 움직임 벡터 해상도가 현재 CU의 움직임 벡터 해상도로서 사용되는 것으로 결정된 경우, 해상도 부호화기(430)는 디폴트 움직임 벡터 해상도가 현재 CU의 움직임 벡터 해상도로서 사용됨을 지시하는 mv_resolution_flag(즉, 제2 식별정보)를 생성한다.
적응적 해상도 결정기(730)에 의해 디폴트 움직임 벡터 해상도가 아닌 대체 해상도가 현재 CU의 움직임 벡터 해상도로서 사용되는 것으로 결정된 경우, 해상도 부호화기(430)는 대체 해상도가 현재 CU의 움직임 벡터 해상도로서 사용됨을 지시하는 mv_resolution_flag를 생성하고 mv_resolution_flag에 대한 정보를 부호화한다.
제2실시예
제2실시예는, 움직임 벡터 해상도를 디폴트 움직임 벡터 해상도와 대체 해상도 사이에서 적응적으로 결정할지 여부를 선택하는 영상 단위가 대체 해상도를 결정하는 영상 단위의 상위 레벨 영상 단위이고, 대체 해상도를 결정하는 영상 단위는 CU의 상위 레벨 영상 단위인 경우를 예시한 실시예이다.
제1실시예는, 움직임 벡터 해상도를 디폴트 움직임 벡터 해상도와 대체 해상도 사이에서 적응적으로 결정할지 여부를 선택하는 영상 단위와 대체 해상도를 결정하는 영상 단위가 서로 같고, 그 두 영상 단위가 각각 CU 보다 큰 경우를 예시한 실시예이다.
움직임 벡터 해상도를 적응적으로 결정할지 여부가 영상 시퀀스 단위마다 해상도 모드 결정기(710)에 의해 선택되는 경우에, 해상도 부호화기(430)는 움직임 벡터 해상도를 적응적으로 결정할지 여부를 나타내는 플래그인 Adaptive_MV_resolution_enabled_flag를 SPS에 삽입한다.
또한, 움직임 벡터 해상도를 적응적으로 결정할지 여부가 픽처 단위마다 해상도 모드 결정기(710)에 의해 선택되는 경우에, 해상도 부호화기(430)는 움직임 벡터 해상도를 적응적으로 결정할지 여부를 나타내는 플래그인 Adaptive_MV_resolution_enabled_flag를 PPS에 삽입한다.
여기서, 움직임 벡터 해상도를 적응적으로 결정하는 것으로 선택된 경우에 Adaptive_MV_resolution_enabled_flag=ON으로 설정되고, 움직임 벡터 해상도를 적응적으로 결정하지 않는 것으로 선택된 경우에는 Adaptive_MV_resolution_enabled_flag=OFF로 설정된다.
대체 해상도 결정기(720)가 대체 해상도를 결정하는 단위는 Adaptive_MV_resolution_enabled_flag가 설정되는 영상 단위보다 작고 CU 보다는 큰 영상 단위(예컨대, 슬라이스 또는 CTU)로 결정될 수 있다. 이 경우 해상도 부호화기(430)는 대체 해상도를 나타내는 정보인 alternative_mv_resolution 정보를 슬라이스 또는 CTU마다 생성하여 alternative_mv_resolution 정보를 부호화한다.
만일, 기정의된 복수의 움직임 벡터 해상도 후보 중에서 하나를 대체 해상도로서 선택하는 경우에는, 해상도 부호화기(430)는, 기정의된 복수의 움직임 벡터 해상도 후보 중에서 선택된 대체 해상도를 식별하는 정보로서 alternative_mv_resolution 정보를 생성하여 부호화한다.
한편, alternative_mv_resolution 정보의 값이 0을 가리키는 경우, 해당 슬라이스 또는 CTU 내 모든 CU의 움직임 벡터 해상도는 적응적으로 결정하지 않는 것으로 판단할 수 있다.
또한, 움직임 벡터 해상도를 적응적으로 결정하는 것으로 선택된 경우, 해상도 부호화기(430)는 대체 해상도의 사용 여부를 나타내는 플래그인 Alternative_enabled_flag 정보를 슬라이스 또는 CTU마다 생성하여 Alternative_enabled_flag 정보를 부호화한다.
여기서, 대체 해상도를 사용하는 것으로 선택된 경우에는 대체 해상도를 나타내는 정보인 alternative_mv_resolution 정보를 슬라이스 또는 CTU마다 생성하여 alternative_mv_resolution 정보를 부호화한다.
만일, 적응적 해상도 결정기(730)에 의해 디폴트 움직임 벡터 해상도가 현재 CU의 움직임 벡터 해상도로서 사용되는 것으로 결정된 경우, 해상도 부호화기(430)는 디폴트 움직임 벡터 해상도가 현재 CU의 움직임 벡터 해상도로서 사용됨을 지시하는 mv_resolution_flag를 생성하고 mv_resolution_flag에 대한 정보를 부호화한다.
적응적 해상도 결정기(730)에 의해 디폴트 움직임 벡터 해상도가 아닌 대체 해상도가 현재 CU의 움직임 벡터 해상도로서 사용되는 것으로 결정된 경우, 해상도 부호화기(430)는 대체 해상도가 현재 CU의 움직임 벡터 해상도로서 사용됨을 지시하는 mv_resolution_flag를 생성하여 mv_resolution_flag에 대한 정보를 부호화한다.
제3실시예
제3실시예는, 움직임 벡터 해상도를 디폴트 움직임 벡터 해상도와 대체 해상도 사이에서 적응적으로 결정할지 여부를 선택하는 영상 단위가 대체 해상도를 결정하는 영상 단위의 상위 레벨 영상 단위이고, 대체 해상도를 결정하는 영상 단위는 CU 단위인 경우를 예시한 실시예이다.
움직임 벡터 해상도를 적응적으로 결정할지 여부가 영상 시퀀스 단위, 픽처 단위, 슬라이스 단위 또는 CTU 단위마다 해상도 모드 결정기(710)에 의해 선택되는 경우에, 해상도 부호화기(430)는 움직임 벡터 해상도를 적응적으로 결정할지 여부를 나타내는 플래그인 Adaptive_MV_resolution_enabled_flag를 SPS, PPS, 슬라이스 헤더 또는 CTU 헤더에 각각 삽입한다.
제1 및 제2 실시예에서와 마찬가지로, 움직임 벡터 해상도를 적응적으로 결정하는지 여부가 선택된 결과에 따라 Adaptive_MV_resolution_enabled_flag가 ON로 또는 OFF로 설정된다.
만일, 움직임 벡터 해상도 결정에 있어서 적응적 방법을 사용하는 것으로 해상도 모드 결정기(710)에 의해 선택된 경우, 디폴트 움직임 벡터 해상도가 현재 CU의 움직임 벡터 해상도로서 선택되면, 해상도 부호화기(430)는 디폴트 움직임 벡터 해상도가 현재 CU의 움직임 벡터 해상도로서 사용됨을 지시하는 mv_resolution_flag를 생성하고 mv_resolution_flag에 대한 정보를 부호화한다.
제3 실시예에서, 대체 해상도 결정기(720)가 대체 해상도를 결정하는 단위는 움직임 벡터 해상도가 결정되는 단위와 동일한 CU 단위이다.
디폴트 움직임 벡터 해상도가 아닌 대체 해상도가 현재 CU의 움직임 벡터 해상도로서 사용되는 경우, 해상도 부호화기(430)는 대체 해상도가 현재 CU의 움직임 벡터 해상도로서 사용됨을 지시하는 mv_resolution_flag를 생성하고, 대체 해상도 결정기(720)가 결정한 대체 해상도에 대한 정보인 alternative_mv_resolution 정보를 생성하여 mv_resolution_flag 및 alternative_mv_resolution에 대한 정보를 부호화한다.
기정의된 복수의 움직임 벡터 해상도 후보 중에서 하나를 대체 해상도로서 선택하는 경우에는, 해상도 부호화기(430)는, 기정의된 복수의 움직임 벡터 해상도 후보 중에서 선택된 대체 해상도를 식별하는 정보로서 alternative_mv_resolution 정보를 부호화한다.
한편, 적응적 해상도 결정기(730)는, 디폴트 움직임 벡터 해상도와 대체 해상도 중 어느 하나를 현재 CU의 움직임 벡터 해상도로서 결정하는 대신에, 복수의 움직임 벡터 해상도 후보들 중에서 어느 하나를 현재 CU의 움직임 벡터 해상도로 결정할 수도 있다. 이 경우, 결정된 현재 CU의 움직임 벡터 해상도 정보를 효율적으로 부호화하기 위해, 해상도 부호화기(430)는 현재 CU의 움직임 벡터 해상도 정보 자체를 부호화하는 대신에 현재 CU의 움직임 벡터 해상도와 대체 해상도와의 차분값, 또는 현재 CU의 움직임 벡터 해상도와 이전 CU의 움직임 벡터 해상도와의 차분값으로서 부호화할 수 있다.
도 8은 현재 CU의 움직임 벡터 해상도 정보를 해상도 차분값으로 부호화하는 경우의 해상도 부호화기(430)를 예시한 도면이다.
도 8에 도시한 바와 같이, 해상도 부호화기(430)는 부호화정보 생성기(810) 및 해상도 차분값 계산기(820)를 포함한다. 구체적인 동작을 이하의 제4 실시예를 통해 설명한다.
제4실시예
움직임 벡터 해상도를 적응적으로 결정하는 것으로 시퀀스, 픽처, 슬라이스 단위 또는 CTU 단위마다 해상도 모드 결정기(710)에 의해 선택되는 경우에, 부호화정보 생성기(810)는 각각 상위 영상 단위인 시퀀스, 픽처, 슬라이스 단위 또는 CTU 단위마다 Adaptive_MV_resolution_enabled_flag을 ON으로 설정한다.
또한, 부호화정보 생성기(810)는 상위 영상 단위 내의 CU마다 디폴트 움직임 벡터 해상도가 해당 CU의 움직임 벡터 해상도로서 사용되는지 여부를 확인한다. 만일, 현재 CU에 대하여 디폴트 움직임 벡터 해상도가 현재 CU의 움직임 벡터 해상도로서 사용되는 경우 부호화정보 생성기(810)는, 현재 CU에 대응하는 mv_resolution_flag를 OFF로 설정한다. 만일, 현재 CU에 대하여 디폴트 움직임 벡터 해상도가 현재 CU의 움직임 벡터 해상도로서 사용되지 않고 복수의 움직임 벡터 해상도 후보들 중에서 선택된 어느 하나가 현재 CU의 움직임 벡터 해상도로서 사용되는 경우, 부호화정보 생성기(810)는, 현재 CU에 대응하는 mv_resolution_flag를 ON으로 설정한다.
또한, Adaptive_MV_resolution_enabled_flag가 설정되는 단위와 동일한 영상 단위마다 대체 해상도 결정기(720)가 대체 해상도 값을 결정하는 경우, 부호화정보 생성기(810)는 결정된 대체 해상도 값을 Adaptive_MV_resolution_enabled_flag가 설정되는 단위와 동일한 영상 단위마다 alternative_mv_resolution 정보로서 부호화한다.
전술하였듯이, 대체 해상도 값이 결정되는 단위는 Adaptive_MV_resolution_enabled_flag가 설정되는 단위와 동일한 영상 단위마다 결정되는 것에 한정되지 않고, CU 단위마다 결정되거나, Adaptive_MV_resolution_enabled_flag가 설정되는 단위보다 작고 CU 단위보다 큰 영상 단위마다 결정될 수도 있으나, 이에 대한 설명은 전술하였으므로 더 이상의 상세한 설명은 생략한다.
복수의 움직임 벡터 해상도 후보들 중에서 선택된 어느 하나가 현재 CU의 움직임 벡터 해상도로서 사용되는 경우, 해상도 차분값 계산기(820)는, 현재 CU의 움직임 벡터 해상도 값과 이전 CU의 움직임 벡터 해상도 값 사이의 차분값(즉, 현재 CU의 움직임 벡터 해상도 값에서 이전 CU의 움직임 벡터 해상도 값을 감산한 값)인 해상도 차분값을 현재 CU의 움직임 벡터 해상도에 관한 정보에 포함되는 요소로서 계산한다.
다만, 해상도 차분값 계산기(820)는, 현재 CU가 상위 레벨 영상 단위의 부호화 순서상 맨 처음의 CU인 경우, 현재 CU의 움직임 벡터 해상도 값을 해상도 차분값 정보로서 결정하거나, 대체 해상도 결정기(720)에서 결정된 대체 해상도 값을 해상도 차분값 정보로서 결정할 수도 있다.
또한, 복수의 움직임 벡터 해상도 후보들 중에서 선택된 어느 하나가 현재 CU의 움직임 벡터 해상도로서 사용되는 경우, 해상도 차분값 계산기(820)는, 현재 CU의 움직임 벡터 해상도 값과 alternative_mv_resolution 값 사이의 차분값(즉, 현재 CU의 움직임 벡터 해상도 값에서 alternative_mv_resolution 값을 감산한 값)인 해상도 차분값을 현재 CU의 움직임 벡터 해상도에 관한 정보에 포함되는 요소로서 계산한다.
해상도 차분값 계산기(820)에서 결정된 해상도 차분값 정보는 mv_resolution_delta로서 저장된다.
만일, 현재 CU의 움직임 벡터 해상도 값을 mv_resolution_delta 값으로서 결정하는 경우 대체 해상도 값은 생성될 필요가 없으므로, 대체 해상도 결정기(720)의 동작은 생략될 수 있다.
부호화정보 생성기(810)는, 해상도 모드 결정기(710) 및 적응적 해상도 결정기(730)에서 수행한 결과에 기초하여 현재 CU의 움직임 벡터 해상도에 대한 부호화 정보를 생성하여 부호화한다. 부호화정보 생성기(810)는, 해상도 모드 결정기(710)에서 상위 레벨 영상 단위에 포함되는 CU들의 움직임 벡터 해상도를 적응적으로 결정할지 여부를 선택한 결과에 따라 Adaptive_MV_resolution_enabled_flag를 ON 또는 OFF로 부호화한다.
Adaptive_MV_resolution_enabled_flag이 ON인 경우, 적응적 해상도 결정기(730)는 디폴트 움직임 벡터 해상도를 현재 CU의 움직임 벡터 해상도로서 사용할지 또는 복수의 움직임 벡터 해상도 후보들 중에서 선택된 어느 하나를 현재 CU의 움직임 벡터 해상도로서 결정할지 선택할 수 있다. 부호화정보 생성기(810)는, 이 선택의 결과에 따라 mv_resolution_flag를 부호화하며, Adaptive_MV_resolution_enabled_flag이 OFF인 경우에는 mv_resolution_flag를 부호화하지 않는다.
또한, 부호화정보 생성기(810)는, mv_resolution_flag가 ON인 경우(즉, 복수의 움직임 벡터 해상도 후보들 중에서 선택된 어느 하나가 현재 CU의 움직임 벡터 해상도로서 사용되는 경우), 해상도 차분값 계산기(820)에서 산출한 해상도 차분값에 대한 정보인 mv_resolution_delta를 부호화한다. 만일, mv_resolution_flag가 OFF인 경우(즉, 디폴트 움직임 벡터 해상도가 현재 CU의 움직임 벡터 해상도로서 사용되는 경우), 부호화정보 생성기(810)는, mv_resolution_delta를 부호화하지 않는다.
한편, 해상도 부호화기(430)는 해상도 차분값을 '-' 연산에 의한 값 대신 나눗셈에 의한 해상도 비율 인자(scale factor)로 표현할 수 있다. 더 나아가, 그 비율 인자는 로그 스케일(log scale)로 표현될 수 있으며, 그 구체적인 동작은 제5실시예를 통하여 설명한다.
제5실시예
도 9는 현재 CU의 움직임 벡터를 해상도 차분값 대신 해상도 비율 인자로 표현하는 해상도 부호화기(430)를 예시한 도면이다.
도 9에 도시한 바와 같이, 해상도 부호화기(430)는 부호화정보 생성기(910) 및 해상도 비율정보 계산기(920)를 포함한다. 도 9의 해상도 비율정보 계산기(920)는 도 8의 해상도 차분값 계산기(820)를 대체하며, 도 9의 부호화정보 생성기(910)는 도 8의 부호화정보 생성기(810)를 대체하도록 구현될 수 있다.
해상도 차분값 계산기(820)가 해상도 차분값을 계산하는 대신에 해상도 비율정보 계산기(920)는 비율 인자를 계산한다는 점과, 해상도 차분값 계산기(820)가 해상도 차분값에 대한 정보로서 mv_resolution_delta를 생성하는 반면에 해상도 비율정보 계산기(920)는 해상도 비율 인자에 대한 정보로서 mv_resolution_scale을 생성한다는 점만 서로 다를 뿐 해상도 차분값 계산기(820)의 나머지 동작과 해상도 비율정보 계산기(920)의 나머지 동작은 서로 동일하다.
예를 들어, 해상도 비율정보 계산기(920)는, 현재 CU의 움직임 벡터 해상도 값과 이전 CU의 움직임 벡터 해상도 값 사이의 비율(즉, 현재 CU의 움직임 벡터 해상도 값에서 이전 CU의 움직임 벡터 해상도 값을 나눈 값)인 해상도 비율 인자를 현재 CU의 움직임 벡터 해상도에 관한 정보에 포함되는 요소로서 계산한다.
다만, 해상도 비율정보 계산기(920)는, 현재 CU가 상위 레벨 영상 단위의 부호화 순서상 맨 처음의 CU인 경우, 현재 CU의 움직임 벡터 해상도 값을 해상도 차분값 정보로서 결정하거나, 대체 해상도 결정기(720)에서 결정된 대체 해상도 값을 해상도 차분값 정보로서 결정할 수도 있다.
또한, 해상도 비율정보 계산기(920)는, 현재 CU의 움직임 벡터 해상도 값과 alternative_mv_resolution 값 사이의 비율(즉, 현재 CU의 움직임 벡터 해상도 값에서 alternative_mv_resolution 값을 나눈 값)인 해상도 비율 인자를 현재 CU의 움직임 벡터 해상도에 관한 정보에 포함되는 요소로서 계산한다.
해상도 비율정보 계산기(920)에서 결정된 해상도 차분값 정보는 mv_resolution_scale로서 저장된다.
도 8의 부호화정보 생성기(810)가 mv_resolution_delta를 부호화하는 동작 대신에, 도 9의 부호화정보 생성기(910)에서는 해상도 비율 인자에 대한 정보(mv_resolution_scale)를 부호화하는 동작을 수행하는 것만 서로 다를 뿐 도 8의 부호화정보 생성기(810)의 도 9의 부호화정보 생성기(910)의 나머지 동작은 서로 동일하다.
이상의 영상 부호화 장치의 실시예에서, 움직임 벡터 해상도가 결정되는 블록의 단위가 CU인 것으로 설명했지만 본발명이 이에 한정되지는 않으며, 실시예에 따라서 이 블록의 기준이 CTU일 수 있으며, 움직임 벡터 해상도가 결정되는 블록의 단위가 CTU인 경우에는 CTU에 포함된 모든 CU가 같은 움직임 벡터 해상도 값을 가질 수 있다. 또한, 해당 CTU 내에 포함된 CU 중 mvp 모드에 해당하는 모든 CU가 해당 CTU에 대한 움직임 벡터 해상도와 같은 움직임 벡터 해상도 값을 가질 수 있다.
이하에서는 영상 복호화 장치에 대해 설명한다.
도 10은 일반적인 영상 복호화 장치를 간략히 도시한 것이다.
영상 복호화 장치(1000)는 복호화부(1010), 역양자화부(1020), 역변환부(1030), 예측부(1040), 가산기(1050), 필터부(1060) 및 메모리(1070)를 포함한다. 도 1의 영상 부호화 장치와 마찬가지로, 영상 복호화 장치는 각 구성요소가 하드웨어 칩으로 구현될 수 있으며, 또는 소프트웨어로 구현되고 마이크로프로세서가 각 구성요소에 대응하는 소프트웨어의 기능을 실행하도록 구현될 수도 있다.
복호화부(1010)는 영상 부호화 장치로부터 수신한 비트스트림을 복호화하여 블록 분할과 관련된 정보를 추출하여 복호화하고자 하는 현재블록을 결정하고, 현재블록을 복원하기 위해 필요한 예측 정보와 잔차신호에 대한 정보 등을 추출한다.
복호화부(1010)는 SPS (Sequence Parameter Set) 또는 PPS (Picture Parameter Set)로부터 CTU size에 대한 정보를 추출하여 CTU의 크기를 결정하고, 픽처를 결정된 크기의 CTU로 분할한다. 그리고 CTU를 트리 구조의 최상위 레이어, 즉, 루트 노드로 결정하고, CTU에 대한 분할 정보를 추출함으로써 CTU를 트리 구조를 이용하여 분할한다. 예컨대, QTBT 구조를 사용하여 CTU를 분할하는 경우, 먼저 QT의 분할과 관련된 제1 플래그(QT_split_flag)를 추출하여 각 노드를 하위 레이어의 네 개의 노드로 분할한다. 그리고, QT의 리프 노드에 해당하는 노드에 대해서는 BT의 분할과 관련된 제2 플래그(BT_split_flag) 및 분할 타입 정보를 추출하여 해당 리프 노드를 BT 구조로 분할한다.
도 2의 블록 분할 구조를 예로 들면, QTBT 구조의 최상위 레이어의 노드에 대응하는 QT 분할 플래그(QT_split_flag)를 추출한다. 추출된 QT 분할 플래그(QT_split_flag)의 값은 1이므로, 최상위 레이어의 노드는 하위 레이어(QT의 layer 1)의 네 개의 노드로 분할된다. 그리고, layer 1의 첫 번째 노드에 대한 QT 분할 플래그(QT_split_flag)를 추출한다. 추출된 QT 분할 플래그(QT_split_flag) 값은 0이므로, layer 1의 첫 번째 노드는 더 이상 QT 구조로 분할되지 않는다.
QT의 layer 1의 첫 번째 노드는 QT의 리프 노드가 되므로, QT의 layer 1의 첫 번째 노드를 BT의 루트 노드로 하는 BT로 진행한다. BT의 루트 노드, 즉 (layer 0))에 대응하는 BT 분할 플래그(BT_split_flag)를 추출한다. BT 분할 플래그(BT_split_flag)는 1이므로, BT의 루트 노드는 (layer 1)의 두 개의 노드로 분할된다. BT의 루트 노드가 분할되므로, BT의 루트 노드에 대응하는 블록이 세로로 분할되는지 아니면 가로로 분할되는지 여부를 지시하는 분할 타입 정보를 추출한다. 분할 타입 정보가 1이므로, BT의 루트 노드에 대응하는 블록은 세로로 분할된다. 이후, BT의 루트 노드로부터 분할된 (layer 1)의 첫 번째 노드에 대한 BT 분할 플래그(BT_split_flag)를 추출한다. BT 분할 플래그(BT_split_flag)가 1이므로, (layer 1)의 첫 번째 노드의 블록의 분할 타입 정보를 추출한다. (layer 1)의 첫 번째 노드의 블록의 분할 타입 정보가 1이므로 (layer 1)의 첫 번째 노드의 블록은 세로로 분할된다. 이후, BT의 루트 노드로부터 분할된 (layer 1)의 두 번째 노드의 BT 분할 플래그(BT_split_flag)를 추출한다. BT 분할 플래그(BT_split_flag)가 0이므로, 더 이상 BT에 의해 분할되지 않는다.
이렇게, 복호화부(1010)는 먼저 QT 분할 플래그(QT_split_flag)를 반복적으로(recursively) 추출하여 CTU를 QT 구조로 분할한다. 그리고 QT의 리프 노드에 대해서는 BT 분할 플래그(BT_split_flag)를 추출하고, BT 분할 플래그(BT_split_flag)가 분할을 지시하면 분할 타입 정보를 추출한다. 이러한 방식을 통해 복호화부(1010)은 CTU가 도 2의 (a)와 같은 구조로 분할됨을 확인할 수 있다.
한편, SPS 또는 PPS에 MinQTSize, MaxBTSize, MaxBTDepth, MinBTSize 등의 정보가 추가로 정의되어 있는 경우에는, 복호화부(1010)는 해당 정보를 추출하고 QT 및 BT에 대한 분할 정보를 추출할 때 이 정보를 반영할 수 있다.
예컨대, QT에서 MinQTSize 과 동일한 크기를 가지는 블록은 더 이상 분할되지 않는다. 따라서 복호화부(1010)는 해당 블록의 QT에 관한 분할 정보(QT 분할 플래그)를 비트스트림으로부터 추출하지 않으며(즉, 비트스트림에는 해당 블록의 QT 분할 플래그가 존재하지 않음), 그 값을 자동으로 0으로 설정한다. 또한, QT에서 MaxBTSize보다 큰 크기를 가지는 블록은 BT가 존재하지 않는다. 따라서, 복호화부(1010)는 QT에서 MaxBTSize보다 큰 크기의 블록을 가지는 리프 노드에 대한 BT 분할 플래그가 추출하지 않으며, BT 분할 플래그를 자동으로 0으로 설정한다. 또한, BT의 해당 노드의 심도(depth)가 MaxBTDepth에 도달하면, 해당 노드의 블록은 더 이상 분할되지 않는다. 따라서, 해당 노드의 BT 분할 플래그를 비트스트림으로부터 추출되지 않으며, 그 값을 자동으로 0으로 설정한다. 또한, BT에서 MinBTSize와 동일한 크기를 가지는 블록은 더 이상 분할되지 않는다. 따라서, 복호화부(1010)는 MinBTSize와 동일한 크기를 가지는 블록의 BT 분할 플래그를 비트스트림으로부터 추출되지 않으며, 그 값을 자동으로 0으로 설정한다.
한편, 복호화부(1010)는 트리 구조의 분할을 통해 복호화하고자 하는 현재블록(현재블록)을 결정하게 되면, 현재블록이 인트라 예측되었는지 아니면 인터 예측되었는지를 지시하는 예측 타입에 대한 정보를 추출한다.
예측 타입 정보가 인터 예측을 지시하는 경우, 복호화부(1010)는 인터 예측정보에 대한 신택스 요소를 추출한다. 먼저, 현재블록의 움직임정보가 복수의 부호화 모드 중 어느 모드에 의해 부호화되었는지 여부를 지시하는 모드 정보를 추출한다. 여기서, 복수의 부호화 모드는 머지 모드 및 차분 움직임벡터 부호화 모드를 포함한다. 모드 정보가 머지 모드를 지시하는 경우, 복호화부(1010)는 머지 후보들 중 어느 후보로부터 현재블록의 움직임벡터를 유도할지 여부를 지시하는 머지 인덱스 정보를 움직임정보에 대한 신택스 요소로서 추출한다. 반면, 모드 정보가 차분 움직임벡터 부호화 모드를 지시하는 경우, 복호화부(1010)는 차분 움직임벡터에 대한 정보 및 현재블록의 움직임벡터가 참조하는 참조 픽처에 대한 정보를 움직임벡터에 대한 신택스 요소로서 추출한다. 한편, 영상 부호화 장치가 복수의 예측 움직임벡터 후보들 중에서 어느 하나의 후보를 현재블록의 예측 움직임벡터로 사용한 경우에는 예측 움직임벡터 식별정보가 비트스트림에 포함된다. 따라서 이 경우에는, 차분 움직임벡터에 대한 정보와 참조 픽처에 대한 정보뿐만 아니라 예측 움직임벡터 식별정보도 움직임벡터에 대한 신택스 요소로서 추출한다.
한편, 복호화부(1010)는 잔차신호에 대한 정보로서 현재블록의 양자화된 변환계수들에 대한 정보를 추출한다.
역양자화부(1020)는 양자화된 변환계수들을 역양자화하고 역변환부(1030)는 역양자화된 변환계수들을 주파수 도메인으로부터 공간 도메인으로 역변환하여 잔차신호들을 복원함으로써 현재블록에 대한 잔차블록을 생성한다.
예측부(1040)는 인트라 예측부(1042) 및 인터 예측부(1044)를 포함한다. 인트라 예측부(1042)는 현재블록의 예측 타입인 인트라 예측일 때 활성화되고, 인터 예측부(1044)는 현재블록의 예측 타입인 인트라 예측일 때 활성화된다.
인트라 예측부(1042)는 복호화부(1010)로부터 추출된 인트라 예측 모드에 대한 신택스 요소로부터 복수의 인트라 예측 모드 중 현재블록의 인트라 예측 모드를 결정하고, 인트라 예측 모드에 따라 현재블록 주변의 참조 픽셀들을 이용하여 현재블록을 예측한다.
인터 예측부(1044)는 복호화부(1010)로부터 추출된 인트라 예측 모드에 대한 신택스 요소를 이용하여 현재블록의 움직임정보를 결정하고, 결정된 움직임정보를 이용하여 현재블록을 예측한다.
먼저, 인터 예측부(1044)는 복호화부(1010)로부터 추출된 인터 예측에서의 모드 정보를 확인한다. 모드 정보가 머지 모드를 지시하는 경우, 인터 예측부(1044)는 현재블록의 주변블록을 이용하여 기 결정된 개수의 머지 후보를 포함하는 머지 리스트를 구성한다. 인터 예측부(1044)가 머지 리스트를 구성하는 방법은 영상 부호화 장치의 인터 예측부(124)와 동일하다. 그리고, 복호화부(1010)로부터 전달된 머지 인덱스 정보를 이용하여 머지 리스트 내의 머지 후보들 중에서 하나의 머지 후보를 선택한다. 그리고 선택된 머지 후보의 움직임정보, 즉, 머지 후보의 움직임벡터와 참조 픽처를 현재블록의 움직임벡터와 참조픽처로 설정한다.
반면, 모드 정보가 차분 움직임벡터 부호화 모드를 지시하는 경우, 인터 예측부(1044)는 현재블록의 주변블록들의 움직임벡터를 이용하여 예측 움직임벡터 후보들을 유도하고, 예측 움직임벡터 후보들을 이용하여 현재블록의 움직임벡터에 대한 예측 움직임벡터를 결정한다. 인터 예측부(1044)가 예측 움직임벡터 후보들을 유도하는 방법은 영상 부호화 장치의 인터 예측부(124)가 예측 움직임벡터 후보들을 유도하는 방법과 동일하다. 만약, 영상 부호화 장치가 복수의 예측 움직임벡터 후보들 중에서 어느 하나의 후보를 현재블록의 예측 움직임벡터로 사용한 경우에는 움직임정보에 대한 신택스 요소는 예측 움직임벡터 식별정보를 포함한다. 따라서, 이 경우에, 인터 예측부(1044)는 예측 움직임벡터 후보들 중 예측 움직임벡터 식별정보에 의해 지시되는 후보를 예측 움직임벡터로 선택할 수 있다. 그러나, 영상 부호화 장치가 복수의 예측 움직임벡터 후보들에 기 정의된 함수를 사용하여 예측 움직임벡터를 결정한 경우에는, 인터 예측부는 영상 부호화 장치와 동일한 함수를 적용하여 예측 움직임벡터를 결정할 수도 있다. 현재블록의 예측 움직임벡터가 결정되면, 인터 예측부(1044)는 예측 움직임벡터와 복호화부(1010)로부터 전달된 차분 움직임벡터를 가산하여 현재블록의 움직임벡터를 결정한다. 그리고 복호화부(1010)로부터 전달된 참조픽처에 대한 정보를 이용하여 현재블록의 움직임벡터가 참조하는 참조픽처를 결정한다.
머지 모드 또는 차분 움직임벡터 부호화 모드에서 현재블록의 움직임벡터와 참조픽처가 결정되면, 인터 예측부(1042)는 참조픽처 내에서 움직임벡터가 지시하는 위치의 블록을 이용하여 현재블록의 예측블록을 생성한다.
가산기(1050)는 역변환부로부터 출력되는 잔차블록과 인터 예측부 또는 인트라 예측부로부터 출력되는 예측블록을 가산하여 현재블록을 복원한다. 복원된 현재블록 내의 픽셀들은 이후에 복호화할 블록을 인트라 예측할 때의 참조픽셀로서 활용된다.
필터부(1060)는 블록 단위의 복호화로 인해 발생하는 블록킹 현상(blocking artifact)를 제거하기 위해 복원된 블록 간의 경계를 디블록킹 필터링하고 메모리(1070)에 저장한다. 한 픽처 내의 모든 블록들이 복원되면, 복원된 픽처는 이후에 복호화하고자 하는 픽처 내의 블록을 인터 예측하기 위한 참조 픽처로 사용된다.
도 11은 본 발명의 일 실시예에 따른 영상 복호화 장치(1100)를 도시한 도면이다.
본 발명의 일 실시예에 따른 영상 복호화 장치(1100)는 움직임 벡터 해상도 복호화기(1110) 및 영상 복호화기(1120)를 포함한다.
움직임 벡터 해상도 복호화기(1110)는 현재 CU의 움직임 벡터 해상도에 관한 정보를 비트스트림으로부터 추출하고, 추출된 움직임 벡터 해상도에 관한 정보에 기초하여 현재 CU의 움직임을 추정하기 위한 움직임 벡터 해상도를 결정한다.
영상 복호화기(1120)는, 현재 CU의 움직임 벡터 해상도에 따라 결정되는 현재 CU의 움직임 벡터를 이용하여 현재 CU를 예측하고 복호화한다.
여기서, 영상 복호화기(1120)는 도 10에서 전술한 영상 복호화 장치(1000)로서 구현될 수 있다.
또한, 움직임 벡터 해상도 복호화기(1110)의 기능은 전술한 영상 복호화 장치(1000) 내의 복호화부(1010)의 기능에 포함되어 복호화부(1010)와 일체로 구현될 수도 있다.
도 12는 본 발명의 제1실시예에 따른 영상 복호화 장치(1100)에서 영상을 복호화하는 방법을 도시한 흐름도이다.
도 12에 도시한 바와 같이, 본 발명의 제1실시예에 따른 영상 복호화 장치(1100)에서 움직임 벡터 해상도 복호화기(1110)는 비트스트림으로부터 Adaptive_MV_resolution_enabled_flag(즉, 제1 식별정보)를 추출한다(S1210). Adaptive_MV_resolution_enabled_flag는 움직임 벡터 해상도를 적응적으로 결정하는지 여부를 나타내는 식별정보로서 상위 레벨 영상 단위인 영상 시퀀스, 픽처, 슬라이스 및 CTU 중 적어도 하나의 영상 단위로 결정되는 정보이며, 영상 시퀀스, 픽처, 슬라이스 및 CTU 중 적어도 하나의 상위 레벨 영상 단위의 비트스트림 헤더로부터 추출된다.
움직임 벡터 해상도 복호화기(1110)는 Adaptive_MV_resolution_enabled_flag를 추출한 후에, Adaptive_MV_resolution_enabled_flag의 의미가 상위 레벨 영상 단위 내의 CU들의 움직임 벡터 해상도가 적응적으로 결정됨을 의미하는지(즉, Adaptive_MV_resolution_enabled_flag가 ON인 경우) 아니면 디폴트 움직임 벡터 해상도가 상위 레벨 영상 단위 내의 CU들의 움직임 벡터 해상도로서 사용됨을 의미하는지(즉, Adaptive_MV_resolution_enabled_flag가 OFF인 경우)를 확인한다(S1220).
S1220 단계에서의 확인 결과, Adaptive_MV_resolution_enabled_flag가 ON인 경우, 움직임 벡터 해상도 복호화기(1110)는 대체 해상도에 관한 정보인 alternative_mv_resolution을 비트스트림으로부터 추출한다(S1230). 여기서, alternative_mv_resolution은 Adaptive_MV_resolution_enabled_flag가 전송되는 영상단위와 같은 영상 단위마다 추출될 수도 있고, Adaptive_MV_resolution_enabled_flag가 전송되는 영상단위보다 작은 영상단위마다 비트스트림으로부터 추출될 수도 있다. 또한, alternative_mv_resolution은 Adaptive_MV_resolution_enabled_flag가 전송되는 영상단위 내의 움직임 벡터 해상도가 결정되는 CU 단위마다 추출될 수도 있다.
S1230 단계 이후에, 움직임 벡터 해상도 복호화기(1110)는 부호화 대상 CU(즉, 현재 CU)의 부호화모드가 차분 움직임 벡터를 부호화하는 모드인지 여부에 따라 부호화 대상 CU의 움직임 벡터 해상도를 결정한다(S1240). 상위 영상 단위마다 Adaptive_MV_resolution_enabled_flag 및 대체 해상도에 관한 정보가 비트스트림으로 전송되는 경우, 상위 영상 단위 내의 CU마다 적응적으로 움직임 벡터 해상도가 결정될 수도 있다.
또한, 영상 시퀀스 및 픽처 중에서 하나의 상위 영상 단위마다 Adaptive_MV_resolution_enabled_flag에 대한 정보가 전송되고 상위 영상 단위보다 작은 영상 단위인 슬라이스(또는 CTU)마다 alternative_mv_resolution이 비트스트림으로 전송되는 경우, 슬라이스(또는 CTU) 내의 영상 단위인 CU마다 적응적으로 움직임 벡터 해상도가 결정될 수도 있다.
S1220 단계에서의 확인 결과, Adaptive_MV_resolution_enabled_flag가 OFF인 경우, 움직임 벡터 해상도 복호화기(1110)는 현재 CU의 부호화모드가 차분 움직임 벡터를 부호화하는 모드인지 여부에 따라 부호화 대상 CU의 움직임 벡터 해상도를 결정하는 동작(S1240)을 수행한다.
여기서, S1240 동작은 S1241 ~ S1246 단계를 포함한다.
움직임 벡터 해상도 복호화기(1110)는 S1230 단계 이후에, 현재 CU의 부호화모드를 비트스트림으로부터 복호화하고, 현재 CU의 부호화모드가 예측 움직임 벡터를 이용하여 차분 움직임 벡터를 부호화하는 모드(즉, mvp 모드)인지 여부를 확인한다(S1241).
S1241 단계에서의 확인 결과 현재 CU의 부호화모드가 mvp 모드인 것으로 확인된 경우에, 움직임 벡터 해상도 복호화기(1110)는 Adaptive_MV_resolution_enabled_flag의 의미가 상위 레벨 영상 단위 내의 CU들의 움직임 벡터 해상도가 적응적으로 결정됨을 의미하는지(즉, Adaptive_MV_resolution_enabled_flag가 ON인 경우) 아니면 디폴트 움직임 벡터 해상도가 상위 레벨 영상 단위 내의 CU들의 움직임 벡터 해상도로서 사용됨을 의미하는지(즉, Adaptive_MV_resolution_enabled_flag가 OFF인 경우)를 확인한다(S1242).
S1242 단계에서의 확인 결과, Adaptive_MV_resolution_enabled_flag가 ON인 경우, 움직임 벡터 해상도 복호화기(1110)는 디폴트 움직임 벡터 해상도 및 대체 해상도 중에서 어느 것이 현재 CU의 움직임 벡터 해상도로서 사용되는지를 지시하는 식별정보인 mv_resolution_flag(즉, 제2 식별정보)를 비트스트림으로부터 복호화하고(S1243), S1243 단계 이후 S1244 이하의 과정을 거친다.
여기서, mv_resolution_flag가 CU 단위로 전송되는 것으로 설명되었으나, 실시예에 따라서는 mv_resolution_flag 를 CTU 단위로 복호화하고 해당 CTU 내 CU별로 mvp 모드인지 여부를 확인하여 해당 CU가 mvp 모드이면 S1244 이하의 과정을 거치는 것으로 구현될 수도 있다.
움직임 벡터 해상도 복호화기(1110)는 mv_resolution_flag를 복호화한 후에, mv_resolution_flag의 의미가 무엇인지를 확인한다(S1244).
S1244 단계에서의 확인 결과 대체 해상도가 현재 CU의 움직임 벡터 해상도로서 사용됨을 mv_resolution_flag가 지시하는 경우(즉, mv_resolution_flag가 ON), 움직임 벡터 해상도 복호화기(1110)는 대체 해상도를 현재 CU의 움직임 벡터 해상도로서 결정한다(S1245).
S1244 단계에서의 확인 결과, 디폴트 움직임 벡터 해상도가 현재 CU의 움직임 벡터 해상도로서 사용됨을 mv_resolution_flag가 지시하는 경우(즉, mv_resolution_flag가 OFF), 움직임 벡터 해상도 복호화기(1110)는 디폴트 움직임 벡터 해상도를 현재 CU의 움직임 벡터 해상도로서 결정한다(S1246).
S1242 단계에서의 확인 결과, Adaptive_MV_resolution_enabled_flag가 OFF인 경우, 움직임 벡터 해상도 복호화기(1110)는 디폴트 움직임 벡터 해상도를 현재 CU의 움직임 벡터 해상도로서 결정한다(S1246).
예컨대, 움직임 벡터 해상도를 적응적으로 결정할지 여부를 나타내는 Adaptive_MV_resolution_enabled_flag 및 대체 해상도를 나타내는 alternative_mv_resolution 신택스가 SPS에 존재하는 경우, 영상 시퀀스 단위로 본 발명의 방법을 적용할지 여부를 결정할 수 있다.
예를 들어, SPS의 Adaptive_MV_resolution_enabled_flag가 on 이고 SPS의 alternative_mv_resolution 값(즉, 대체 해상도)이 4 pixel이면서, 디폴트 움직임 벡터 해상도가 1/4-pixel 이라면, SPS를 참조하는 영상 시퀀스 내 모든 부호화 대상 CU의 움직임 벡터 해상도는 1/4-pixel 혹은 4-pixel로 결정된다. 즉, 현재 CU의 헤더 정보인 mv_resolution_flag가 off 이면, 현재 CU의 움직임 벡터 해상도는 디폴트 움직임 벡터 해상도에 해당하는 1/4-pixel로 결정되고, 현재 CU의 mv_resolution_flag가 on 이면 현재 CU의 움직임 벡터 해상도는 대체 해상도에 해당하는 4-pixel로서 결정된다.
또한, PPS (또는 슬라이스 헤더)에 Adaptive_MV_resolution_enabled_flag 및 alternative_mv_resolution 신택스가 존재하는 경우, 픽처 단위(또는 슬라이스 단위)로 본 발명의 방법을 적용할지 여부를 결정할 수 있다.
예를 들어, PPS의 Adaptive_MV_resolution_enabled_flag가 on 이고 PPS의 alternative_mv_resolution 값(즉, 대체 해상도)이 4 pixel이면서, 디폴트 움직임 벡터 해상도가 1/4-pixel 이라면, PPS(또는 슬라이스 헤더)를 참조하는 픽처(또는 슬라이스) 내 모든 부호화 대상 현재 CU의 움직임 벡터 해상도는 1/4-pixel 혹은 4-pixel 로 결정된다. 즉, 부호화 대상 현재 CU의 헤더 정보인 mv_resolution_flag가 off 이면, 현재 CU의 움직임 벡터 해상도는 디폴트 움직임 벡터 해상도에 해당하는 1/4-pixel로 결정되고, 현재 CU의 mv_resolution_flag가 on 이면 현재 CU의 움직임 벡터 해상도는 대체 해상도에 해당하는 4-pixel로서 결정된다.
만일, SPS(또는 PPS)에 Adaptive_MV_resolution_enabled_flag가 On이고, 영상 시퀀스(또는 픽처)보다 작은 영상 단위인 슬라이스(또는 CTU)의 헤더의 alternative_mv_resolution 값이 4 pixel이면서 디폴트 움직임 벡터 해상도가 1/4-pixel 이라면, 해당 슬라이스(또는 CTU) 내 모든 부호화 대상 CU의 움직임 벡터의 해상도는 디폴트 움직임 벡터 해상도에 해당하는 1/4-pixel 혹은 alternative_mv_resolution 값에 해당하는 4-pixel로 결정되어 현재 CU의 움직임 벡터가 1/4-pixel 혹은 4-pixel 단위로 표현된다. 즉, 부호화 대상 CU의 헤더 정보인 mv_resolution_flag가 0(즉 off) 이면, 현재 CU의 움직임 정보를 1/4-pixel로 표현하고, 현재 CU의 mv_resolution_flag가 on 이면 4-pixel 단위로 표현한다.
또한, SPS(또는 PPS)에 Adaptive_MV_resolution_enabled_flag가 On이고, 영상 시퀀스(또는 픽처)보다 작은 영상 단위인 슬라이스(또는 CTU)의 헤더의 alternative_mv_resolution 값이 0이면서 디폴트 움직임 벡터 해상도가 1/4-pixel 이라면, 해당 슬라이스(또는 CTU) 내 모든 부호화 대상 CU의 움직임 벡터의 해상도는 디폴트 움직임 벡터 해상도에 해당하는 1/4-pixel로 결정되어 현재 CU의 움직임 벡터가 1/4-pixel 단위로 표현된다. 여기서, 부호화 대상 CU의 헤더 정보인 mv_resolution_flag는 필요하지 않다.
또한, SPS(또는 PPS)에 Adaptive_MV_resolution_enabled_flag가 On이고, 영상 시퀀스(또는 픽처)보다 작은 영상 단위인 슬라이스(또는 CTU)의 헤더의 Alternative_enabled_flag의 값에 따라 해당 슬라이스(또는 CTU) 내 모든 부호화 대상 CU의 움직임 벡터의 해상도를 결정한다. 예를 들어, Alternative_enabled_flag가 off 이면서 디폴트 움직임 벡터 해상도가 1/4-pixel 이라면, 해당 슬라이스(또는 CTU) 내 모든 부호화 대상 CU의 움직임 벡터의 해상도는 디폴트 움직임 벡터 해상도에 해당하는 1/4-pixel로 표현되고, 부호화 대상 CU의 헤더 정보인 mv_resolution_flag는 필요하지 않다. 반대로, Alternative_enabled_flag가 on 이고 alternative_mv_resolution 값이 4 pixel이면서 디폴트 움직임 벡터 해상도가 1/4-pixel 이라면, 해당 슬라이스(또는 CTU) 내 모든 부호화 대상 CU의 움직임 벡터의 해상도는 디폴트 움직임 벡터 해상도에 해당하는 1/4-pixel 혹은 alternative_mv_resolution 값에 해당하는 4-pixel로 결정되어 현재 CU의 움직임 벡터가 1/4-pixel 혹은 4-pixel 단위로 표현된다. 즉, 부호화 대상 CU의 헤더 정보인 mv_resolution_flag가 0(즉 off) 이면, 현재 CU의 움직임 정보를 1/4-pixel로 표현하고, 현재 CU의 mv_resolution_flag가 on 이면 4-pixel 단위로 표현한다.
도 13은 적응적으로 해상도를 결정하는 한 예를 나타낸 도면이다.
만일, SPS 헤더의 Adaptive_MV_resolution_enabled_flag 가 on 이고, slice #0 헤더의 alternative_mv_resolution 값이 2 pixel이면서, 디폴트 움직임 벡터 해상도(default MV resolution)가 1/4-pixel 라면, 해당 슬라이스 #0 내의 원 모양을 포함하는 부호화 대상 CU의 움직임 벡터 해상도는 디폴트 움직임 벡터 해상도에 해당하는 1/4-pixel 혹은 alternative_mv_resolution에 해당하는 2-pixel 로 결정된다. 이 경우, 부호화 대상 CU의 헤더 정보인 mv_resolution_flag가 off 이면, 현재 CU의 움직임 벡터를 디폴트 움직임 벡터 해상도에 해당하는 1/4-pixel 단위로 표현하고, 현재 CU의 mv_resolution_flag가 on 이면 현재 CU의 움직임 벡터를 alternative_mv_resolution에 해당하는 2-pixel 단위로 표현한다.
slice #1 헤더의 alternative_mv_resolution 값이 4 pixel이라면, slice #1 내의 세모 모양을 포함하는 부호화 대상 CU의 움직임 벡터 해상도는 디폴트 움직임 벡터 해상도에 해당하는 1/4-pixel 혹은 alternative_mv_resolution에 해당하는 4-pixel로 결정된다. 이 경우, 부호화 대상 CU의 헤더 정보인 mv_resolution_flag가 off 이면, 현재 CU의 움직임 벡터를 디폴트 움직임 벡터 해상도에 해당하는 1/4-pixel로 표현하고, 현재 CU의 mv_resolution_flag가 on 이면 현재 CU의 움직임 벡터를 alternative_mv_resolution에 해당하는 4-pixel 단위로 표현한다.
S1245 단계 또는 S1246 단계 이후에는, 영상 복호화기(1120)는 예측 움직임 벡터를 이용하여 현재블록의 움직임 벡터를 도출한다(S1250).
여기서, S1250 동작은 S1251 ~ S1255 단계를 포함한다.
S1251 단계에서, 영상 복호화기(1120)는, 예측 움직임벡터 후보들을 유도하고, 예측 움직임벡터 후보들로부터 현재 CU의 예측 움직임 벡터를 식별하기 위한 정보(mvp_idx)를 비트스트림으로부터 추출한다. 여기서, 예측 움직임벡터 후보들을 위해 사용되는 주변블록으로는, 도 3에 도시된 현재 픽처 내에서 현재 CU에 인접한 좌측블록(L), 상단블록(A), 우상단블록(AR), 좌하단블록(BL), 좌상단블록(AL) 중에서 전부 또는 일부가 사용될 수 있다.
영상 복호화기(1120)는 mvp_idx에 해당하는 블록의 움직임 벡터 해상도가 현재 CU의 움직임 벡터 해상도와 같은지 확인한다(S1252).
영상 복호화기(1120)는, mvp_idx에 해당하는 블록의 움직임 벡터 해상도가 현재 CU의 움직임 벡터 해상도와 같은 것으로 확인된 경우에는, 차분 움직임 벡터를 비트스트림으로부터 복호화한다(S1254). 만일, mvp_idx에 해당하는 예측 움직임 벡터 해상도가 현재 CU의 움직임 벡터 해상도와 다른 것으로 확인된 경우에는, 예측 움직임 벡터의 해상도가 현재 CU의 움직임 벡터 해상도와 같도록 예측 움직임 벡터의 크기를 스케일링(Scaling)하고(S1253) 차분 움직임 벡터를 비트스트림으로부터 복호화한다(S1254).
영상 복호화기(1120)는, 차분 움직임 벡터를 비트스트림으로부터 복호화한 후에 차분 움직임 벡터와 예측 움직임 벡터를 합산하여 현재 CU의 움직임 벡터를 산출한다(S1255).
예를 들어, 현재 CU의 움직임 벡터 해상도가 2-pixel 이고, mvp_idx에 해당하는 블록의 움직임 벡터 해상도가 1/4-pixel 이면서 mvp_idx에 해당하는 블록의 움직임 벡터 값이 3으로 설정된 경우, mvp_idx에 해당하는 블록의 실제 움직임 벡터 값은 0.75에 해당하므로, 현재 CU의 움직임 벡터 해상도에 해당하는 2-pixel 움직임 벡터 해상도로 스케일링 하면 mvp_idx에 해당하는 블록의 실제 움직임 벡터 값은 0으로 변환된다. 이에 대한 변환 공식은 수학식 1과 같다.
[수학식 1]
MV' = Round(MV × neighbor_MV_Resol / curr_MV_Resol)
여기서, MV은 mvp_idx에 해당하는 블록의 움직임 벡터 값이고, neighboring_MV_resol은 mvp_idx에 해당하는 블록의 움직임 벡터 해상도 값이며, current_MV_resol은 현재 CU의 움직임 벡터 해상도 값이고, MV'은 scaling 된 실제 움직임 벡터 값이 되며, Round는 반올림 연산을 의미한다.
또한, Adaptive_MV_resolution_enabled_flag, mv_resolution_flag 및 alternative_mv_resolution 등은 x축, y축 각각의 좌표에 따라 개별적으로 설정될 수 있으며, 현재 CU의 움직임 벡터 해상도도 수학식 2와 같이 x축, y축 각각의 좌표에 따라 개별적으로 산출할 수도 있다.
[수학식 2]
MVx' = Round(MVx × neighbor_MVx_Resol / curr_MVx_Resol)
MVy' = Round(MVy × neighbor_MVy_Resol / curr_MVy_Resol)
영상 복호화기(1120)는, S1241 단계에서의 확인 결과, 현재 CU의 부호화모드가 mvp 모드가 아닌 것으로 확인된 경우에(예컨대, 머지 모드), 시간적 또는 공간적 주변블록의 움직임 벡터(즉, 머지 후보들)로부터 현재 CU의 움직임 벡터를 도출한다(S1260).
여기서, S1260 동작은 S1261 ~ S1264 단계를 포함한다.
영상 복호화기(1120)는, S1241 단계에서의 확인 결과, 현재 CU의 부호화모드가 mvp 모드가 아닌 것으로 확인된 경우에 현재 CU의 머지 후보들로부터 현재 CU의 움직임 벡터를 식별하기 위한 정보(candid_idx)를 비트스트림으로부터 추출한다(S1261). 현재 CU의 머지 후보들은 도 3에 도시된 현재 픽처 내에서 현재 CU에 인접한 좌측블록(L), 상단블록(A), 우상단블록(AR), 좌하단블록(BL), 좌상단블록(AL) 중에서 전부 또는 일부가 사용될 수 있다. 또한, 현재 CU가 위치한 현재 픽처가 아닌 참조 픽처(현재 CU를 예측하기 위해 사용된 참조 픽처와 동일할 수도 있고 다를 수도 있음) 내에 위치한 블록이 움직임 벡터 후보(즉, 머지 후보)로서 사용될 수도 있다. 예컨대, 참조 픽처 내에서 현재 CU와 동일 위치에 있는 블록(co-located block) 또는 그 동일 위치의 블록에 인접한 블록들이 머지 후보로서 추가로 더 사용될 수 있다.
영상 복호화기(1120)는, 비트스트림으로부터 추출한 candid_idx에 대응하는 블록의 움직임 벡터 해상도가 머지 모드를 위하여 기정의된 움직임 벡터 해상도와 같은지 여부를 확인한다(S1262). 여기서, 머지 모드를 위하여 기정의된 움직임 벡터 해상도는, 영상 시퀀스, 픽처 및 슬라이스 중에서 어느 하나의 단위에서 정의된 움직임 벡터 해상도일 수 있다.
영상 복호화기(1120)는, candid_idx에 대응하는 블록의 움직임 벡터 해상도가 머지 모드를 위하여 기정의된 움직임 벡터 해상도와 서로 같은 경우에는 candid_idx에 대응하는 블록의 움직임 벡터를 현재 CU의 움직임 벡터로서 결정한다(S1264). 만일, candid_idx에 대응하는 블록의 움직임 벡터 해상도가 기정의된 움직임 벡터 해상도와 다른 경우에는 candid_idx에 대응하는 블록의 움직임 벡터 해상도가 기정의된 움직임 벡터 해상도와 같아지도록 candid_idx에 대응하는 블록의 움직임 벡터를 스케일링하고(S1263) 해당 스케일링된 움직임 벡터를 현재 CU의 움직임 벡터로서 결정한다(S1264).
참고로, S1240 동작, S1250 동작 및 S1260 동작은 각 부호화 단위 CU마다 순차적으로 반복하여 수행될 수 있다.
도 14는 도 12의 흐름도에서 일부 단계가 추가된 경우를 도시한 흐름도이다.
도 14에서는 S1240 동작은 S1241, S1242_1, S1242_2, S1243, S1244, S1245 및 S1246 단계를 포함한다. 또한, 도 14에서 S1250 동작은 S1251, S1252, S1253 및 S1255 단계를 포함한다.
도 14에서는 도 12의 경우와 비교할 때, S1240 동작 내에서 도 12의 S1242 단계 대신에 S1242_1 단계 및 S1242_2 단계가 추가되고, S1250 동작 내에서 도 12의 S1254 단계가 제외된 형태를 갖는다.
참고로, 도 14의 기능 블록 중에서, 별다른 언급이 없는 한 도 12에 기재된 블록번호와 동일한 번호를 갖는 기능블록은 그 동작이 서로 동일하다. 예컨대, 도 14의 S1243 단계의 동작은 도 12의 S1243 단계의 동작과 서로 동일하다.
도 14에서는, S1241 단계에서 현재 CU의 부호화모드가 예측 움직임 벡터를 이용하여 차분 움직임 벡터를 부호화하는 모드(즉, mvp 모드)인지 여부를 확인한 결과, 현재 CU의 부호화모드가 mvp 모드인 것으로 확인된 경우에, 영상 복호화기(1120)는 차분 움직임 벡터에 대한 정보(mvd)를 비트스트림으로부터 복호화한다(S1242_1).
S1242_1 단계에서 차분 움직임 벡터를 복호화한 후에, 움직임 벡터 해상도 복호화기(1110)는, 차분 움직임 벡터가 0이 아닌지 여부와 Adaptive_MV_resolution_enabled_flag가 ON인지 여부를 확인한다(S1242_2). 만일, 차분 움직임 벡터가 0이 아니고 Adaptive_MV_resolution_enabled_flag가 ON인 경우에 S1243 단계로 진행한다. 만일, 차분 움직임 벡터가 0이거나 Adaptive_MV_resolution_enabled_flag가 ON이 아닌 경우에는 S1246 단계로 진행한다.
한편, 도 14의 S1252 단계에서 영상 복호화기(1120)가 mvp_idx에 해당하는 블록의 움직임 벡터 해상도가 현재 CU의 움직임 벡터 해상도와 같은 것으로 확인한 경우에, 영상 복호화기(1120)는 차분 움직임 벡터와 예측 움직임 벡터를 합산하여 현재 CU의 움직임 벡터를 산출한다(S1255). 도 14의 S1252 단계에서 영상 복호화기(1120)가 mvp_idx에 해당하는 블록의 움직임 벡터 해상도가 현재 CU의 움직임 벡터 해상도와 같지 않은 것으로 확인한 경우에는, 예측 움직임 벡터의 해상도가 현재 CU의 움직임 벡터 해상도와 같도록 예측 움직임 벡터의 크기를 스케일링(Scaling)하는 S1253 단계를 수행하고, S1253 단계 이후에 차분 움직임 벡터와 예측 움직임 벡터를 합산하여 현재 CU의 움직임 벡터를 산출하는 S1255 단계를 실행한다.
한편, S1251 단계는 S1242_1 단계 앞에서 실행될 수도 있으며, S1242_1 단계와 S1242_2 단계 사이에서 실행될 수도 있다.
도 15는 본 발명의 제2실시예에 따른 영상 복호화 장치(1100)에서 영상을 복호화하는 방법을 도시한 흐름도이다.
도 15의 경우에 대하여 구체적인 예를 들어 설명하면, SPS (PPS, 슬라이스, 또는 CTU 헤더)에 Adaptive_MV_resolution_enabled_flag 가 존재하며 부호화 대상 CU 헤더에 mv_resolution_flag 및 alternative_mv_resolution 정보가 존재하는 경우, 영상 시퀀스 단위(픽처 단위, 슬라이스 단위, 또는 CTU 단위)로 본 발명의 적응적 움직임 벡터 해상도 결정 방법을 적용할지 여부를 Adaptive_MV_resolution_enabled_flag 값에 따라 결정하고, 부호화 블록 단위인 CU 단위로 적응적 움직임 벡터 결정 여부를 mv_resolution_flag 값에 따라 선택하면서 CU의 움직임 벡터 해상도를 조정할 수 있다.
예를 들어, SPS 헤더(PPS 헤더, 슬라이스 헤더, 또는 CTU 헤더)의 Adaptive_MV_resolution_enabled_flag 가 on 이고, 디폴트 움직임 벡터 해상도가 1/4-pixel 이면서, 부호화 대상 현재 CU의 헤더 정보인 mv_resolution_flag가 off 이면, 현재 CU의 움직임 벡터 해상도의 결정에 alternative_mv_resolution 정보는 필요로 하지 않는다. 이 경우 현재 CU의 움직임 벡터 해상도는 디폴트 움직임 벡터 해상도에 해당하는 1/4-pixel로서 결정되어 현재 CU의 움직임 벡터가 1/4-pixel 단위로 표현된다.
반면에, mv_resolution_flag가 on 이고, CU 헤더의 alternative_mv_resolution 값이 4-pixel 이라면, 현재 CU의 움직임 벡터해상도는 alternative_mv_resolution 값에 해당하는 4-pixel 로 결정되어 현재 CU의 움직임 벡터는 alternative_mv_resolution 값에 해당하는 4-pixel 단위로 표현된다.
도 15에 도시한 바와 같이, 본 발명의 제2실시예에 따른 영상 복호화 장치(1100)에서 움직임 벡터 해상도 복호화기(1110)는 비트스트림으로부터 Adaptive_MV_resolution_enabled_flag를 추출한다(S1510). Adaptive_MV_resolution_enabled_flag는 움직임 벡터 해상도를 적응적으로 결정하는지 여부를 나타내는 식별정보로서 영상 시퀀스, 픽처, 슬라이스 및 CTU 중 적어도 하나의 영상 단위(CU의 상위 레벨 영상 단위)로 결정되는 정보로서, 영상 시퀀스, 픽처, 슬라이스 및 CTU 중 적어도 하나의 영상 단위의 비트스트림 헤더로부터 추출된다.
움직임 벡터 해상도 복호화기(1110)는 영상 시퀀스, 픽처, 슬라이스 및 CTU 중 적어도 하나의 영상 단위마다 Adaptive_MV_resolution_enabled_flag를 추출한 후에, Adaptive_MV_resolution_enabled_flag를 추출하는 영상 단위 내의 각 블록의 부호화모드가 차분 움직임 벡터를 부호화하는 모드인지 여부에 따라 각 블록마다 움직임 벡터 해상도를 결정한다(S1540).
여기서, S1540 동작은 S1541 ~ S1547 단계를 포함한다.
움직임 벡터 해상도 복호화기(1110)는 S1510 단계 이후에, 현재 CU의 부호화모드를 비트스트림으로부터 복호화하고, 현재 CU의 부호화모드가 예측 움직임 벡터를 이용하여 차분 움직임 벡터를 부호화하는 모드(즉, mvp 모드)인지 여부를 확인한다(S1541).
S1541 단계에서의 확인 결과 현재 CU의 부호화모드가 mvp 모드인 것으로 확인된 경우에, Adaptive_MV_resolution_enabled_flag의 의미가 상위 레벨 영상 단위 내의 CU들의 움직임 벡터 해상도가 적응적으로 결정됨을 의미하는지(즉, Adaptive_MV_resolution_enabled_flag가 ON인 경우) 또는 디폴트 움직임 벡터 해상도가 상위 레벨 영상 단위 내의 CU들의 움직임 벡터 해상도로서 사용됨을 의미하는지(즉, Adaptive_MV_resolution_enabled_flag가 OFF인 경우)를 확인한다(S1542).
S1542 단계에서의 확인 결과, Adaptive_MV_resolution_enabled_flag가 OFF인 경우, 움직임 벡터 해상도 복호화기(1110)는 디폴트 움직임 벡터 해상도를 현재 CU의 움직임 벡터 해상도로서 사용한다(S1547).
S1542 단계에서의 확인 결과, Adaptive_MV_resolution_enabled_flag가 ON인 경우, 움직임 벡터 해상도 복호화기(1110)는 디폴트 움직임 벡터 해상도 및 대체 해상도 중에서 어느 것이 현재 CU의 움직임 벡터 해상도로서 사용되는지를 지시하는 식별정보인 mv_resolution_flag를 비트스트림으로부터 복호화한다(S1543).
움직임 벡터 해상도 복호화기(1110)는 mv_resolution_flag를 복호화한 후에, mv_resolution_flag의 의미가 무엇인지를 확인한다(S1544).
S1544 단계에서의 확인 결과, 대체 해상도가 현재 CU의 움직임 벡터 해상도로서 사용됨을 mv_resolution_flag가 지시하는 경우(즉, mv_resolution_flag가 ON), 움직임 벡터 해상도 복호화기(1110)는 현재 CU의 대체 해상도에 관한 정보인 alternative_mv_resolution을 비트스트림으로부터 추출하고(S1545), 추출된 대체 해상도를 현재 CU의 움직임 벡터 해상도로서 결정한다(S1546).
S1544 단계에서의 확인 결과, 디폴트 움직임 벡터 해상도가 현재 CU의 움직임 벡터 해상도로서 사용됨을 mv_resolution_flag가 지시하는 경우(즉, mv_resolution_flag가 OFF), 움직임 벡터 해상도 복호화기(1110)는 디폴트 움직임 벡터 해상도를 현재 CU의 움직임 벡터 해상도로서 결정한다(S1547).
또한, mv_resolution_flag 및/또는 alternative_mv_resolution 정보가 CU 단위로 전송되는 것으로 설명되었으나, 실시예에 따라서는 mv_resolution_flag 및/또는 alternative_mv_resolution를 CTU 단위로 복호화하고 해당 CTU 내 CU별로 mvp 모드인지 여부를 확인하여 해당 CU가 mvp 모드이면 S1540 이하의 과정을 거치는 것으로 구현될 수도 있다.
도 16은 적응적으로 해상도를 결정하는 다른 예를 나타낸 도면이다.
예컨대, SPS 헤더(PPS 헤더, 슬라이스 헤더, 또는 CTU 헤더)의 Adaptive_MV_resolution_enabled_flag 가 on 이고 디폴트 움직임 벡터 해상도가 1/4-pixel 이면서 해당 영상 시퀀스 내의 원 모양을 하는 부호화 대상 CU의 헤더의 mv_resolution_flag가 on이고 alternative_mv_resolution 값이 1 pixel이라면, 해당 부호화 대상 CU들의 움직임 벡터 해상도는 alternative_mv_resolution 값에 해당하는 1-pixel 로 결정되어 해당 부호화 대상 CU들의 움직임 벡터는 1-pixel 단위로 표현된다.
또한, 해당 영상 시퀀스 내의 세모 모양을 하는 부호화 대상 CU의 헤더의 mv_resolution_flag가 on이고 alternative_mv_resolution 값이 4 pixel이라면, 해당 부호화 대상 CU의 움직임 벡터 해상도는 alternative_mv_resolution 값에 해당하는 4-pixel 로 결정되어 해당 부호화 대상 CU의 움직임 벡터는 alternative_mv_resolution 값에 해당하는 4-pixel 단위로 표현된다. 또한, mv_resolution_flag값을 off로 설정한 부호화 대상 CU의 경우, 해당 부호화 CU의 움직임 벡터 해상도는 디폴트 움직임 벡터 해상도에 해당하는 1/4-pixel로 결정되어 해당 부호화 대상 CU의 움직임 벡터는 디폴트 움직임 벡터 해상도에 해당하는 1/4-pixel 단위로 표현할 수 있다.
S1546 단계 또는 S1547 단계 이후에, 영상 복호화기(1120)는 예측 움직임 벡터를 이용하여 현재블록의 움직임 벡터를 도출한다(S1550).
도 15에서, S1550 동작은 S1551 ~ S1555 단계를 포함한다.
S1551 ~ S1555 단계는 각각 S1251 ~ S1255 단계와 유사한 동작을 하므로 S1551 ~ S1555 단계의 상세한 설명은 생략한다.
영상 복호화기(1120)는, S1341 단계에서의 확인 결과, 해당 CU의 부호화모드가 mvp 모드가 아닌 것으로 확인된 경우에(예컨대, 머지 모드), 시간적 또는 공간적 주변블록의 움직임 벡터(즉, 머지 후보들)로부터 현재 CU의 움직임 벡터를 도출한다(S1560).
여기서, S1560 동작은 S1561 ~ S1564 단계를 포함한다.
S1561 ~ S1564 단계는 각각 S1261 ~ S1264 단계와 유사한 동작을 하므로 S1561 ~ S1564 단계의 상세한 설명은 생략한다.
도 17은 도 15의 흐름도에서 일부 단계가 추가된 경우를 도시한 흐름도이다.
도 17에서는 S1540 동작은 S1541, S1542_1, S1542_2, S1543, S1544, S1545, S1546 및 S1547 단계를 포함한다. 또한, 도 17에서 S1550 동작은 S1551, S1552, S1553 및 S1555 단계를 포함한다.
참고로, 도 17의 기능 블록 중에서, 별다른 언급이 없는 한 도 15에 기재된 블록번호와 동일한 번호를 갖는 기능블록은 그 동작이 서로 동일하다. 예컨대, 도 17의 S1543 단계의 동작은 도 15의 S1543 단계의 동작과 서로 동일하다.
도 17에서는, S1541 단계에서 현재 CU의 부호화모드가 예측 움직임 벡터를 이용하여 차분 움직임 벡터를 부호화하는 모드(즉, mvp 모드)인지 여부를 확인한 결과, 현재 CU의 부호화모드가 mvp 모드인 것으로 확인된 경우에, 영상 복호화기(1120)는 차분 움직임 벡터에 대한 정보(mvd)를 비트스트림으로부터 복호화한다(S1542_1).
S1542_1 단계에서 차분 움직임 벡터를 복호화한 후에, 움직임 벡터 해상도 복호화기(1110)는, 차분 움직임 벡터가 0이 아닌지 여부와 Adaptive_MV_resolution_enabled_flag가 ON인지 여부를 확인한다(S1542_2). 만일, S1542_2 단계에서의 확인 결과, 차분 움직임 벡터가 0이 아니고 Adaptive_MV_resolution_enabled_flag가 ON인 경우에 S1543 단계로 진행한다. 만일, 차분 움직임 벡터가 0이거나 Adaptive_MV_resolution_enabled_flag가 ON이 아닌 경우에는 S1547 단계로 진행한다.
한편, S1551 단계는 S1542_1 단계 앞에서 실행될 수도 있으며, S1542_1 단계와 S1542_2 단계 사이에서 실행될 수도 있다.
도 17의 S1551, S1552, S1553 및 S1555 단계는 각각 도 14의 S1251, S1252, S1253 및 S1255 단계와 유사한 동작을 하므로 도 17의 S1551, S1552, S1553 및 S1555 단계의 상세한 설명은 생략한다.
도 18은 본 발명의 제3실시예에 따른 영상 복호화 장치(1100)에서 영상을 복호화하는 방법을 도시한 흐름도이다.
도 18에 도시한 바와 같이, 본 발명의 제3실시예에 따른 영상 복호화 장치(1100)에서 움직임 벡터 해상도 복호화기(1110)는 비트스트림으로부터 Adaptive_MV_resolution_enabled_flag를 추출한다(S1810). Adaptive_MV_resolution_enabled_flag는 움직임 벡터 해상도를 적응적으로 결정하는지 여부를 나타내는 식별정보로서 상위 레벨 영상 단위인 영상 시퀀스, 픽처, 슬라이스 및 CTU 중 적어도 하나의 영상 단위로 결정되는 정보로서, 영상 시퀀스, 픽처, 슬라이스 및 CTU 중 적어도 하나의 영상 단위의 비트스트림 헤더로부터 추출된다.
움직임 벡터 해상도 복호화기(1110)는 Adaptive_MV_resolution_enabled_flag의 의미가 영상 시퀀스, 픽처, 슬라이스 및 CTU 중 적어도 하나의 상위 레벨 영상 단위에서(즉, 상위 레벨 영상 단위 내의 모든 CU들에서) 움직임 벡터 해상도가 적응적으로 결정됨을 의미하는지(즉, ON인 경우) 또는 디폴트 움직임 벡터 해상도가 상위 레벨 영상 단위 내의 모든 CU들의 움직임 벡터 해상도로서 사용됨을 의미하는지(즉, OFF인 경우)를 확인한다(S1820).
S1820 단계에서의 확인 결과, Adaptive_MV_resolution_enabled_flag가 OFF인 경우, 움직임 벡터 해상도 복호화기(1110)는 해당 영상 단위 내의 CU들의 경우는 디폴트 움직임 벡터 해상도를 해당 CU들의 움직임 벡터 해상도로서 사용한다(S1822).
S1820 단계에서의 확인 결과, Adaptive_MV_resolution_enabled_flag가 ON인 경우, 움직임 벡터 해상도 복호화기(1110)는 대체 해상도에 관한 정보인 alternative_mv_resolution을 비트스트림으로부터 추출한다(S1830). 여기서, alternative_mv_resolution은 Adaptive_MV_resolution_enabled_flag가 전송되는 영상단위와 동일한 영상 단위마다 비트스트림으로부터 추출될 수도 있다.
또한, alternative_mv_resolution은 Adaptive_MV_resolution_enabled_flag가 전송되는 영상단위보다 작고 움직임 벡터 해상도가 결정되는 블록 단위인 CU보다 큰 영상단위마다 비트스트림으로부터 추출될 수도 있다. 예컨대, Adaptive_MV_resolution_enabled_flag가 전송되는 영상단위가 영상 시퀀스 및 픽처 중에서 하나인 경우, alternative_mv_resolution이 추출되는 단위는 슬라이스 단위(또는 CTU 단위)일 수 있다.
또한, alternative_mv_resolution은 Adaptive_MV_resolution_enabled_flag가 전송되는 영상단위 내의 움직임 벡터 해상도가 결정되는 블록 단위인 CU마다 추출될 수도 있다.
또한, alternative_mv_resolution은 어느 위치에서도 추출되지 않을 수도 있다.
S1830 단계 이후에, 움직임 벡터 해상도 복호화기(1110)는 현재 CU의 부호화모드가 차분 움직임 벡터를 부호화하는 모드인지 여부에 따라 현재 CU의 움직임 벡터 해상도를 결정한다(S1840).
여기서, S1840 동작은 S1841 ~ S1848 단계를 포함한다.
움직임 벡터 해상도 복호화기(1110)는 S1830 단계 이후에, 현재 CU의 부호화모드를 비트스트림으로부터 복호화하고, 현재 CU의 부호화모드가 예측 움직임 벡터를 이용한 차분 움직임 벡터를 부호화하는 모드(즉, mvp 모드)인지 여부를 확인한다(S1841).
S1841 단계에서의 확인 결과 현재 CU의 부호화모드가 mvp 모드인 것으로 확인된 경우에, 움직임 벡터 해상도 복호화기(1110)는 Adaptive_MV_resolution_enabled_flag의 의미가 상위 레벨 영상 단위 내의 CU들의 움직임 벡터 해상도가 적응적으로 결정됨을 의미하는지(즉, Adaptive_MV_resolution_enabled_flag가 ON인 경우) 아니면 디폴트 움직임 벡터 해상도가 상위 레벨 영상 단위 내의 CU들의 움직임 벡터 해상도로서 사용됨을 의미하는지(즉, Adaptive_MV_resolution_enabled_flag가 OFF인 경우)를 확인한다(S1842).
S1842 단계에서의 확인 결과, Adaptive_MV_resolution_enabled_flag가 ON인 경우, 움직임 벡터 해상도 복호화기(1110)는 디폴트 움직임 벡터 해상도 및 대체 해상도 중에서 어느 것이 현재 CU의 움직임 벡터 해상도로서 사용되는지를 지시하는 식별정보인 mv_resolution_flag를 비트스트림으로부터 복호화한다(S1843).
S1842 단계에서의 확인 결과, Adaptive_MV_resolution_enabled_flag가 OFF인 경우, 움직임 벡터 해상도 복호화기(1110)는 디폴트 움직임 벡터 해상도를 현재 CU의 움직임 벡터 해상도로서 결정한다(S1848).
움직임 벡터 해상도 복호화기(1110)는, S1843 단계에서 현재 CU의 mv_resolution_flag를 복호화한 후에, mv_resolution_flag의 의미가 무엇인지를 확인한다(S1844).
S1844 단계에서의 확인 결과, 현재 CU의 움직임 벡터 해상도 값과 이전 CU의 움직임 벡터 해상도 값 사이의 차분값인 해상도 차분값을 이용하여 현재 CU의 움직임 벡터 해상도를 결정함을 mv_resolution_flag가 지시하는 경우(즉, mv_resolution_flag가 ON), 움직임 벡터 해상도 복호화기(1110)는 현재 CU의 움직임 벡터 해상도 값과 이전 CU의 움직임 벡터 해상도 값 사이의 차분값에 대한 정보인 mv_resolution_delta를 비트스트림으로부터 추출한다(S1845). 여기서, alternative_mv_resolution 값이 존재하지 않고, 현재 CU가 상위 레벨 영상 영역 내의 부호화 순서상 맨 처음 CU인 경우에, mv_resolution_delta는 현재 CU의 움직임 벡터 해상도를 나타내는 정보로서의 기능을 할 수도 있다.
움직임 벡터 해상도 복호화기(1110)는 mv_resolution_delta 값을 이용하여 현재 CU의 움직임 벡터 해상도 값을 산출하고(S1846) 산출된 결과를 현재 CU의 움직임 벡터 해상도로서 결정한다(S1847).
S1844 단계에서의 확인 결과, 디폴트 움직임 벡터 해상도가 현재 CU의 움직임 벡터 해상도로서 사용됨을 mv_resolution_flag가 지시하는 경우(즉, mv_resolution_flag가 OFF), 움직임 벡터 해상도 복호화기(1110)는 디폴트 움직임 벡터 해상도를 현재 CU의 움직임 벡터 해상도로서 결정한다(S1848).
S1846 단계에서, 움직임 벡터 해상도 복호화기(1110)는, 현재 CU가 상위 레벨 영상 단위의 부호화 순서상 맨 처음의 CU인 경우, mv_resolution_delta 값을 현재 CU의 움직임 벡터 해상도 값으로서 결정한다. 또한, 움직임 벡터 해상도 복호화기(1110)는, 현재 CU가 상위 레벨 영상 단위의 부호화 순서상 맨 처음의 CU 이후의 CU인 경우에는, 부호화 순서상 현재 CU의 부호화 직전에 부호화된 CU의 움직임 벡터 해상도 값과 해상도 차분값 mv_resolution_delta 을 서로 합산하여 현재 CU의 움직임 벡터 해상도 값을 산출한다. 이 경우에, 움직임 벡터 해상도 복호화기(1110)는 현재 CU의 움직임 벡터 해상도를 생성하는 데에 alternative_mv_resolution을 필요로 하지 않으므로 비트스트림으로부터 alternative_mv_resolution을 추출하는 동작을 생략할 수 있다.
예를 들어, 슬라이스 헤더의 Adaptive_MV_resolution_enabled_flag 가 on 이고, 디폴트 움직임 벡터 해상도가 1/4-pixel 이면서, 현재 CU의 헤더 정보인 mv_resolution_flag가 off 이면, 현재 CU의 움직임 벡터 해상도의 결정에 mv_resolution_delta 정보는 필요로 하지 않는다. 이 경우, 현재 CU의 움직임 벡터 해상도는 디폴트 움직임 벡터 해상도인 1/4-pixel로 결정되어 현재 CU의 움직임 벡터가 디폴트 움직임 벡터 해상도인 1/4-pixel 단위로 표현된다.
반면에, mv_resolution_flag가 on 이고, 현재 CU가 부호화 순서상 처음 부호화되는 CU인 경우 현재 CU의 mv_resolution_delta 값이 4 pixel이라면, 현재 CU의 움직임 벡터 해상도는 mv_resolution_delta 값에 해당하는 4-pixel로서 현재 CU의 움직임 벡터는 4-pixel 단위로 표현된다. 현재 CU가 부호화 순서상 처음이 아닌 CU인 경우 현재 CU의 mv_resolution_flag가 on이고 현재 CU의 mv_resolution_delta 값이 0이라면, 현재 CU의 움직임 벡터 해상도는 현재 CU의 이전 CU의 움직임 벡터 해상도에 현재 CU의 mv_resolution_delta 값을 합한 해상도인 4-pixel로서 결정되어 현재 CU의 움직임 벡터는 4-pixel 단위로 표현된다.
만약, 현재 CU가 부호화 순서상 맨 처음이 아닌 CU인 경우 현재 CU의 mv_resolution_flag가 on이고 현재 CU의 mv_resolution_delta 값이 -2 pixel이라면, 현재 CU의 움직임 벡터 해상도는 이전 CU의 움직임 벡터 해상도인 4 pixel에 mv_resolution_delta 값에 해당하는 -2 pixel을 합산한 결과인 2-pixel로서 결정되어 현재 CU의 움직임 벡터는 2-pixel 단위로 표현된다.
지금까지 전술한 도 18에 대한 설명은, 움직임 벡터 해상도 복호화기(1110)가 mv_resolution_delta를 현재 CU의 이전 CU의 움직임 벡터 해상도와 합산하여 현재 CU의 움직임 벡터 해상도를 복원하는 것으로 설명하였으나, 본 발명은 이에 한정되지 않는다. 즉, 움직임 벡터 해상도 복호화기(1110)는, 현재 CU의 mv_resolution_delta 값과 대체 해상도 값을 합산하여 현재 CU의 움직임 벡터 해상도 값으로서 복호화하도록 구현될 수도 있다.
도 18의 실시예에 대하여 구체적인 예를 들어 설명하면, Slice(Tile) 헤더(또는, SPS PPS, CTU)에 Adaptive_MV_resolution_enabled_flag 및 alternative_mv_resolution가 존재하며 Slice(Tile) (또는, 영상 시퀀스, 픽처, CTU) 단위 내의 CU의 헤더에 mv_resolution_flag 및 mv_resolution_delta 정보가 존재하는 경우, Adaptive_MV_resolution_enabled_flag 값에 따라 Slice(Tile)(또는, 영상 시퀀스, 픽처, CTU) 단위로 본 발명의 적응적 움직임 벡터 해상도 결정 방법의 적용 여부 및 대체 해상도를 결정하고, 현재 CU의 mv_resolution_flag 값에 따라 Slice(Tile)(또는, 영상 시퀀스, 픽처, CTU) 단위 내의 CU 단위로 적응적으로 움직임 벡터 해상도를 결정하면서 mv_resolution_delta 값을 이용하여 현재 CU의 움직임 벡터 해상도를 조정할 수 있다.
이 경우, 현재 CU의 mv_resolution_delta 값은 Slice(Tile) 헤더(또는, 영상 시퀀스, 픽처, CTU)에 기술된 alternative_mv_resolution 값(즉, 대체 해상도)과 현재 CU의 움직임 벡터 해상도 값 사이의 차분 값으로 표현되며, 현재 CU의 움직임 벡터 해상도 값은 alternative_mv_resolution 값과 mv_resolution_delta 값을 합산한 결과로서 산출될 수 있다.
예를 들어, slice 헤더의 Adaptive_MV_resolution_enabled_flag 가 on 이고, 대체 해상도인 alternative_mv_resolution 값이 4 pixel이며, 디폴트 움직임 벡터 해상도가 1/4-pixel 이면서, 부호화 대상 현재 CU의 헤더 정보인 mv_resolution_flag가 off 이면, 현재 CU의 움직임 벡터 해상도의 결정에 mv_resolution_delta 정보는 필요로 하지 않는다. 이 경우, 현재 CU의 움직임 벡터 해상도는 디폴트 움직임 벡터 해상도에 해당하는 1/4-pixel 이 되어 현재 CU의 움직임 벡터는 1/4-pixel 단위로 표현된다.
만약, 현재 CU의 mv_resolution_flag가 on 이고, 현재 CU의 mv_resolution_delta 값이 0 이라면, 현재 CU의 움직임 벡터 해상도는 alternative_mv_resolution 값과 mv_resolution_delta 값을 더한 값에 해당하는 4-pixel 로 결정되어 현재 CU의 움직임 벡터는 4-pixel 단위로 표현된다. 만약, 현재 CU의 mv_resolution_flag가 on 이고, 현재 CU의 mv_resolution_delta 값이 -2 pixel이라면, 현재 CU의 움직임 벡터 해상도는 slice 헤더의 대체 해상도(alternative_mv_resolution) 값인 4-pixel에서 mv_resolution_delta 값에 해당하는 -2 pixel을 합산한 결과인 2-pixel이 되어 현재 CU의 움직임 벡터 해상도는 해당 합산 결과인 2-pixel 로 결정된다.
도 18의 실시예에 대하여 또다른 구체적인 예를 들어 설명하면, Slice(Tile) 헤더(또는, SPS, PPS, CTU)에 Adaptive_MV_resolution_enabled_flag 및 대체 해상도인 alternative_mv_resolution 이 존재하는 경우 Adaptive_MV_resolution_enabled_flag 값에 따라 slice(Tile) (또는, 영상 시퀀스, 픽처, CTU) 단위로 본 발명의 적응적 움직임 벡터 해상도 결정 방법의 적용 여부 및 대체 해상도를 결정한다. Slice(Tile) (또는, 영상 시퀀스, 픽처, CTU) 단위 내의 CU의 헤더에 mv_resolution_flag 및 mv_resolution_delta 정보가 존재하는 경우 mv_resolution_flag 값에 따라 Slice(Tile) (또는, 영상 시퀀스, 픽처, CTU) 단위 내의 CU 단위로 적응적으로 움직임 벡터 해상도를 결정하면서 mv_resolution_delta 값을 이용하여 현재 CU의 움직임 벡터 해상도를 조정할 수 있다.
여기서, 현재 CU의 mv_resolution_delta 값은 Slice(Tile) 헤더(또는 SPS, PPS, CTU)에 기술된 대체 해상도(alternative_mv_resolution) 값과 현재 CU의 움직임 벡터 해상도 사이의 차분 값으로 표현되거나, 혹은 현재 CU를 기준으로 바로 이전에 부호화된 CU의 움직임 벡터 해상도 값과 현재 CU의 움직임 벡터 해상도 값의 차분 값으로 표현될 수 있다.
예컨대, 현재 CU가 부호화 순서상 맨처음 CU인 경우 현재 CU의 mv_resolution_delta 값은 Slice(Tile) (또는 SPS, PPS, CTU) 헤더에 기술된 대체 해상도(alternative_mv_resolution) 값과 현재 CU의 움직임 벡터 해상도 사이의 차분 값을 의미하고, 현재 CU가 맨처음이 아닌 순서에 나오는 CU인 경우 현재 CU의 mv_resolution_delta 값은 현재 CU를 기준으로 바로 이전에 부호화 된 CU의 움직임 벡터 해상도 값과 현재 CU의 움직임 벡터 해상도 사이의 차분 값으로 표현될 수 있다.
예를 들어, slice 헤더의 Adaptive_MV_resolution_enabled_flag 가 on 이고 대체 해상도인 mv resolution 값이 4 pixel이며, 디폴트 움직임 벡터 해상도가 1/4-pixel 이면서, 부호화 대상 현재 CU의 헤더 정보인 mv_resolution_flag가 off 이면, 현재 CU의 mv_resolution_delta 정보는 현재 CU의 움직임 벡터 해상도 결정에 필요로 하지 않는다. 이 경우 현재 CU의 움직임 벡터 해상도는 디폴트 움직임 벡터 해상도에 해당하는 1/4-pixel로 결정된다.
반면에, 현재 CU의 헤더 정보인 mv_resolution_flag가 on 이고 현재 CU가 맨처음 CU이고 현재 CU의 mv_resolution_delta 값이 +2 pixel이라면, slice(Tile) 헤더에 기술된 대체 해상도(alternative_mv_resolution) 값 4 pixel과 현재 CU의 움직임 벡터 해상도 사이의 차분 값이 +2 pixel이라는 의미이므로, 현재 CU의 움직임 벡터 해상도는 alternative_mv_resolution 값 4 pixel과 해상도 차분값 +2 pixel을 더하여 6-pixel이 된다. 이 경우, 맨처음 CU의 다음 CU의 mv_resolution_flag가 on 이고, 해당 다음 CU의 mv_resolution_delta 값이 -2 pixel이라면, 해당 다음 CU의 움직임 벡터 해상도는 이전 CU의 움직임 벡터 해상도 값인 6 pixel에서 해당 다음 CU의 mv_resolution_delta 값인 -2 pixel을 더하여 4-pixel 이 된다.
도 18의 S1847 단계 또는 S1848 단계 이후에, 영상 복호화기(1120)는 예측 움직임 벡터를 이용하여 현재 CU의 움직임 벡터를 도출한다(S1850).
여기서, S1850 동작은 S1851 ~ S1855 단계를 포함한다.
도 18의 S1851 ~ S1855 단계는 각각 도 12의 S1251 ~ S1255 단계와 유사한 동작을 하므로 S1851 ~ S1855 단계의 상세한 설명은 생략한다.
영상 복호화기(1120)는, S1841 단계에서의 확인 결과, 현재 CU의 부호화모드가 mvp 모드가 아닌 것으로 확인된 경우에(예컨대, 머지 모드), 시간적 또는 공간적 주변블록의 움직임 벡터(즉, 머지 후보들)로부터 현재 CU의 움직임 벡터를 도출한다(S1860).
여기서, S1860 동작은 S1861 ~ S1864 단계를 포함한다.
도 18의 S1861 ~ S1864 단계는 각각 도 12의 S1261 ~ S1264 단계와 유사한 동작을 하므로 S1861 ~ S1864 단계의 상세한 설명은 생략한다.
한편, 도 18은 본발명의 제3실시예에 따른 영상 복호화 장치(1100)의 동작만을 설명하는 것이 아니라, 본발명의 제4실시예에 따른 영상 복호화 장치(1100)의 동작도 설명하고 있는 흐름도이다.
즉, 제4실시예에서, 영상 복호화기(1120)가 mv_resolution_delta 대신에 mv_resolution_scale을 비트스트림으로부터 복호화하고 복호화된 mv_resolution_scale을 이용하여 현재 CU의 움직임 벡터 해상도를 복원할 수도 있다.
제3실시예와 제4실시예는, 도 18의 동작 중에서 S1845 단계 ~ S1846 단계에 해당하는 동작이 서로 다르며 나머지 단계에 해당하는 동작은 서로 동일하다.
제4실시예에서는, S1845 단계의 동작이 mv_resolution_scale을 비트스트림으로부터 추출하며 S1846 단계에서는 mv_resolution_scale을 이용하여 현재 CU의 움직임 벡터 해상도를 복원하도록 구현된다.
제4실시예의 S1845 단계에서, 움직임 벡터 해상도 복호화기(1110)는, S1844 단계에서의 확인 결과 현재 CU의 움직임 벡터 해상도 값에서 이전 CU의 움직임 벡터 해상도 값으로 나눈 값인 해상도 비율 인자를 이용하여 현재 CU의 움직임 벡터 해상도를 결정함을 mv_resolution_flag가 지시하는 경우(즉, mv_resolution_flag가 ON인 경우), 움직임 벡터 해상도 복호화기(1110)는 현재 CU의 움직임 벡터 해상도에서 이전 CU의 움직임 벡터 해상도 값을 나눈 값을 나타내는 정보인 mv_resolution_scale를 비트스트림으로부터 추출한다(S1845). 여기서, mv_resolution_scale은 현재 CU의 움직임 벡터 해상도에서 대체 해상도 값을 나눈 값을 나타내는 정보일 수도 있다.
제4실시예의 S1846 단계에서, 움직임 벡터 해상도 복호화기(1110)는 mv_resolution_scale 값으로부터 현재 CU의 움직임 벡터 해상도 값을 산출한다.
S1846 단계에서, 움직임 벡터 해상도 복호화기(1110)는, 현재 CU가 상위 레벨 영상 단위 내의 부호화 순서상 맨 처음의 CU인 경우 mv_resolution_scale 값에 대응하는 움직임 벡터 해상도를 현재 CU의 움직임 벡터 해상도 값으로서 복호화한다. 또한, 움직임 벡터 해상도 복호화기(1110)는, 현재 CU가 상위 레벨 영상 단위의 부호화 순서상 맨 처음의 CU 이후의 CU인 경우에는, 부호화 순서상 현재 CU의 부호화 직전에 부호화된 CU의 움직임 벡터 해상도 값에 현재 CU의 비율 인자를 곱한 결과를 현재 CU의 움직임 벡터 해상도 값으로서 산출한다. 이 경우에, 대체 해상도는 현재 CU의 움직임 벡터 해상도를 산출하는 데에 필요로 하지 않으므로 움직임 벡터 해상도 복호화기(1110)는 비트스트림으로부터 alternative_mv_resolution을 추출하는 동작을 생략할 수 있다.
또한, mv_resolution_scale 값으로부터 현재 CU의 움직임 벡터 해상도 값을 산출하는 다른 실시예로서, 움직임 벡터 해상도 복호화기(1110)는, 상위 레벨 영상 단위 내의 현재 CU에서 mv_resolution_scale 값에 대체 해상도 값을 곱한 결과를 현재 CU의 움직임 벡터 해상도 값으로서 복호화하도록 구현될 수도 있다.
또한, mv_resolution_scale 값으로부터 현재 CU의 움직임 벡터 해상도 값을 산출하는 또다른 실시예로서, 움직임 벡터 해상도 복호화기(1110)는, 현재 CU가 상위 레벨 영상 단위의 부호화 순서상 맨 처음의 CU인 경우 mv_resolution_scale 값에 대체 해상도 값을 곱하여 현재 CU의 움직임 벡터 해상도 값으로서 복호화하고, 현재 CU가 상위 레벨 영상 단위의 부호화 순서상 맨 처음 CU 이후의 CU인 경우에, 움직임 벡터 해상도 복호화기(1110)는, 부호화 순서상 현재 CU의 부호화 직전에 부호화된 CU의 움직임 벡터 해상도 값에 현재 CU에 대응하여 추출된 mv_resolution_scale 값을 곱한 결과를 현재 CU의 움직임 벡터 해상도 값으로서 산출할 수도 있다.
본발명의 제4실시예에 따른 영상 복호화 장치(1100)의 동작의 예를 들면, Slice(Tile) 헤더(또는, SPS, PPS, CTU)에 Adaptive_MV_resolution_enabled_flag 및 alternative_mv_resolution가 존재하며, 부호화 대상인 CU의 헤더에 mv_resolution_flag 및 mv_resolution_scale 정보가 존재하는 경우, 움직임 벡터 해상도 복호화기(1110)는, Slice(Tile)(또는, 영상 시퀀스, 픽처, CTU) 단위로 본 발명의 적응적 움직임 벡터 해상도 결정 방법의 적용 여부 및 대체 해상도를 결정하고, Slice(Tile)(또는, 영상 시퀀스, 픽처, CTU) 단위 내의 블록 단위로 적응적으로 움직임 벡터 해상도를 적용할지 선택하면서 mv_resolution_scale 값을 이용하여 현재 CU의 움직임 벡터 해상도를 조정할 수 있다.
이 경우, 현재 CU가 상위 영상 영역인 slice(Tile)(또는, 영상 시퀀스, 픽처, CTU) 내의 맨 처음 CU인 경우, mv_resolution_scale 값은 현재 CU의 움직임 벡터 해상도 값에 대응하는 값을 갖도록 표현되고, 현재 CU가 맨 처음 CU 이후에 나오는 CU인 경우 mv_resolution_scale 값은 현재 CU 바로 직전에 부호화된 CU의 움직임 벡터 해상도 값과 현재 CU의 움직임 벡터 해상도 값 사이의 배수 값으로 표현된다.
예를 들어, slice 헤더의 Adaptive_MV_resolution_enabled_flag 가 on 이고, 디폴트 움직임 벡터 해상도가 1/4-pixel 이면서, 현재 CU의 헤더 정보인 mv_resolution_flag가 off 이면, 현재 CU의 mv_resolution_scale 정보를 추출하지 않고 현재 CU의 움직임 벡터 해상도는 디폴트 움직임 벡터 해상도에 해당하는 1/4-pixel로 결정된다.
만일, 현재 CU의 mv_resolution_flag가 on 이고, 현재 CU가 맨 처음의 부호화 CU인 경우 현재 CU의 mv_resolution_scale 값이 4 라면, 현재 CU의 움직임 벡터 해상도는 mv_resolution_scale 값인 4에 대응하는 4-pixel이 된다. 현재 CU가 맨 처음 CU의 다음 CU인 경우 현재 CU의 mv_resolution_flag가 on이고 현재 CU의 mv_resolution_scale 값이 1/2이라면, 현재 CU의 움직임 벡터 해상도는 이전 CU의 움직임 벡터 해상도 4-pixel에 mv_resolution_scale 값 1/2을 곱한 값으로서 2-pixel이 산출된다.
또한, 각 CU의 mv_resolution_scale 값은 Slice(Tile) 헤더(또는 SPS, PPS, CTU)에 포함된 대체 해상도 alternative_mv_resolution 값과 현재 블록의 움직임 벡터 해상도 사이의 배수 값으로 표현될 수도 있다.
예를 들어, slice 헤더의 Adaptive_MV_resolution_enabled_flag 가 on 이고, 대체 해상도인 alternative_mv_resolution 값이 4 pixel이며, 디폴트 움직임 벡터 해상도가 1/4-pixel 이면서, 현재 CU의 헤더 정보인 mv_resolution_flag가 off 이면, 현재 CU의 mv_resolution_scale 정보를 추출하지 않고 현재 CU의 움직임 벡터 해상도는 디폴트 움직임 벡터 해상도에 해당하는 1/4-pixel로 결정된다.
반면, 현재 CU의 mv_resolution_flag가 on 이고, 현재 CU의 mv_resolution_scale 값이 1 이라면, 현재 CU의 움직임 벡터 해상도는 대체 해상도 alternative_mv_resolution 값인 4-pixel에 mv_resolution_scale 값인 1을 곱한 값인 4-pixel이 된다. 만일 이 다음 CU의 mv_resolution_flag가 on이고 mv_resolution_scale 값이 1/2이라면, 해당 CU의 움직임 벡터 해상도는 대체 해상도 값인 4-pixel에 mv_resolution_scale 값인 1/2을 곱한 결과인 2-pixel이 된다.
또한, 각 CU의 mv_resolution_scale 값은 Slice(Tile) 헤더(또는 SPS, PPS)에 기술된 대체 해상도 alternative_mv_resolution 값과 현재 CU의 움직임 벡터 해상도 사이의 배수 값으로 표현되거나, 혹은 현재 CU를 기준으로 바로 이전에 부호화된 CU의 움직임 벡터 해상도 값과 현재 CU의 움직임 벡터 해상도 값 사이의 배수 값으로 표현된다. 즉, 현재 CU가 부호화 순서상 맨처음 나오는 CU인 경우 현재 CU의 mv_resolution_scale 값은 Slice(Tile) 헤더(또는, SPS, PPS)에 기술된 alternative_mv_resolution 값과 현재 CU의 움직임 벡터 해상도 값 사이의 배수 값을 의미하고, 현재 CU가 맨처음 CU 이후의 CU인 경우 현재 CU의 mv_resolution_scale 값은 현재 CU를 기준으로 바로 이전에 부호화된 CU의 움직임 벡터 해상도 값과 현재 CU의 움직임 벡터 해상도 값 사이의 배수 값으로 표현된다.
예를 들어, slice 헤더의 Adaptive_MV_resolution_enabled_flag 가 on 이고 alternative_mv_resolution 값이 4 pixel이며, 디폴트 움직임 벡터 해상도가 1/4-pixel 이면서, 현재 CU의 헤더 정보인 mv_resolution_flag가 off 이면, 현재 CU의움직임 벡터 해상도는 mv_resolution_scale 정보를 필요로 하지 않으므로 현재 CU의 움직임 벡터 해상도는 디폴트 움직임 벡터 해상도에 해당하는 1/4-pixel 로 결정되어 현재 CU의 움직임 벡터는 디폴트 움직임 벡터 해상도에 해당하는 1/4-pixel 단위로 표현된다.
반면에, 현재 CU의 mv_resolution_flag가 on 이고, 현재 CU의 mv_resolution_scale 값이 1 이라면, 현재 CU의 움직임 벡터 해상도는 slice 헤더의 alternative_mv_resolution 값인 4 pixel에 mv_resolution_scale 값인 1을 곱한 값인 4-pixel이 된다. 현재 CU가 맨처음 CU의 다음 CU인 경우 현재 CU의 mv_resolution_flag가 on이고 현재 CU의 mv_resolution_scale 값이 1/2이라면, 현재 CU의 움직임 벡터 해상도는 바로 이전에 부호화된 CU의 움직임 벡터 해상도 값인 4 pixel에 현재 CU의 mv_resolution_scale 값인 1/2을 곱한 값인 2-pixel이 된다.
도 19는 도 18의 흐름도에서 일부 단계가 추가된 경우를 도시한 흐름도이다.
도 19에서는 S1840 동작은 S1841, S1842_1, S1842_2, S1843, S1844, S1845, S1846, S1847 및 S1848 단계를 포함한다. 또한, 도 19에서 S1850 동작은 S1851, S1852, S1853 및 S1855 단계를 포함한다.
도 19에서는 도 18의 경우와 비교할 때, S1240 동작 내에서는 도 18의 S1242 단계 대신에 S1242_1 단계 및 S1242_2 단계가 추가되고, S1250 동작 내에서는 도 18의 S1854 단계가 제외된 형태를 갖는다.
참고로, 도 19의 기능 블록 중에서, 별다른 언급이 없는 한, 도 18에 기재된 블록번호와 동일한 번호를 갖는 기능블록은 그 동작이 서로 동일하다. 예컨대, 도 19의 S1843 단계의 동작은 도 18의 S1843 단계의 동작과 서로 동일하다.
도 19에서는, S1841 단계에서 현재 CU의 부호화모드가 예측 움직임 벡터를 이용하여 차분 움직임 벡터를 부호화하는 모드(즉, mvp 모드)인지 여부를 확인한 결과, 현재 CU의 부호화모드가 mvp 모드인 것으로 확인된 경우에, 영상 복호화기(1120)는 차분 움직임 벡터에 대한 정보(mvd)를 비트스트림으로부터 복호화한다(S1842_1).
S1842_1 단계에서 차분 움직임 벡터를 복호화한 후에, 움직임 벡터 해상도 복호화기(1110)는, 차분 움직임 벡터가 0이 아닌지 여부와 Adaptive_MV_resolution_enabled_flag가 ON인지 여부를 확인한다(S1842_2). 만일, S1842_2 단계에서의 확인 결과, 차분 움직임 벡터가 0이 아니고 Adaptive_MV_resolution_enabled_flag가 ON인 경우에 S1843 단계로 진행한다. 만일, 차분 움직임 벡터가 0이거나 Adaptive_MV_resolution_enabled_flag가 ON이 아닌 경우에는 S1848 단계로 진행한다.
한편, S1851 단계는 S1842_1 단계 앞에서 실행될 수도 있으며, S1842_1 단계와 S1842_2 단계 사이에서 실행될 수도 있다.
도 19의 S1851, S1852, S1853 및 S1855 단계는 각각 도 14의 S1251, S1252, S1253 및 S1255 단계와 유사한 동작을 하므로 도 19의 S1851, S1852, S1853 및 S1855 단계의 상세한 설명은 생략한다.
본 발명의 실시예들에서, 움직임 벡터 해상도 복호화기(1110)가 Adaptive_MV_resolution_enabled_flag를 비트스트림으로부터 추출하는 것으로 예시하였으나, 실시예에 따라서는 영상 복호화 장치(1100) 내의 움직임 벡터 해상도 복호화기(1110)는 비트스트림으로부터 Adaptive_MV_resolution_enabled_flag를 추출하는 동작을 생략할 수 있다. 이 경우, 움직임 벡터 해상도 복호화기(1110)는 Adaptive_MV_resolution_enabled_flag가 ON인 상태에서 수행하는 동작과 동일한 동작을 수행할 수도 있고, Adaptive_MV_resolution_enabled_flag가 OFF인 상태에서 수행하는 동작과 동일한 동작을 수행할 수 있다. 이 경우, 영상 부호화 장치(400)에서도 영상 복호화 장치(1100)의 동작에 상응하여 Adaptive_MV_resolution_enabled_flag를 부호화하는 동작을 생략한다.
한편, 이상의 영상 복호화 장치 실시예에서, mv_resolution_flag를 파싱하여 움직임 벡터 해상도를 결정하는 단위가 CU 단위인 것에 한정되지 않으며, mv_resolution_flag를 파싱하여 디폴트 움직임 벡터 해상도 또는 대체 해상도 중에서 하나를 움직임 벡터 해상도로서 결정하는 단위가 CTU 단위일 수도 있다. 움직임 벡터 해상도가 결정되는 블록의 단위가 CTU인 경우에는 CTU에 포함된 모든 CU가 같은 움직임 벡터 해상도 값을 가질 수 있다. 이 경우, CTU 단위의 상위 레벨 영상 단위는 영상 시퀀스, 픽처 또는 슬라이스 중에서 하나일 수 있다.
이상의 설명은 본 실시예의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 실시예의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 실시예들은 본 실시예의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 실시예의 기술 사상의 범위가 한정되는 것은 아니다. 본 실시예의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 실시예의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
CROSS-REFERENCE TO RELATED APPLICATION
본 특허출원은 2016년 10월 19일 한국에 출원한 특허출원번호 제10-2016-0136066호와 2017년 2월 27일 한국에 출원한 특허출원번호 제10-2017-0025673호에 대해 미국 특허법 119(a)조(35 U.S.C §119(a))에 따라 우선권을 주장하면, 그 모든 내용은 참고문헌으로 본 특허출원에 병합된다. 아울러, 본 특허출원은 미국 이외에 국가에 대해서도 위와 동일한 이유로 우선권을 주장하면 그 모든 내용은 참고문헌으로 본 특허출원에 병합된다.

Claims (15)

  1. 영상을 부호화하는 방법에 있어서,
    현재블록의 움직임 벡터 해상도를 결정하는 단계;
    상기 현재블록의 움직임 벡터 해상도에 따라 상기 현재블록의 움직임 벡터를 결정하는 단계;
    상기 현재블록의 움직임 벡터를 이용하여 상기 현재블록을 예측하고 부호화하는 단계; 및
    상기 현재블록의 움직임 벡터 해상도에 관한 정보를 부호화하는 단계
    를 포함하는 것을 특징으로 하는 영상 부호화 방법.
  2. 제1항에 있어서, 상기 정보를 부호화하는 단계는,
    상기 현재블록을 그 내부에 포함하는 영상 영역인 상위 레벨 영상 영역 단위로 움직임 벡터 해상도를 적응적으로 결정하는지 여부를 지시하는 제1 식별정보를 상기 현재블록의 움직임 벡터 해상도에 관한 정보의 한 요소로서 부호화하는 것을 특징으로 하는 영상 부호화 방법.
  3. 제2항에 있어서,
    상기 현재블록의 움직임 벡터 해상도를 결정하는 단계는, 상기 상위 레벨 영상 영역 단위로 움직임 벡터 해상도를 적응적으로 결정하는 것으로 선택된 경우, 대체 해상도를 결정하는 단계를 포함하고,
    상기 정보를 부호화하는 단계는, 상기 대체 해상도에 관한 정보를 상기 현재블록의 움직임 벡터 해상도에 대한 정보의 한 요소로서 부호화하는 단계를 포함하는 것을 특징으로 하는 영상 부호화 방법.
  4. 제3항에 있어서, 상기 정보를 부호화하는 단계는,
    상기 상위 레벨 영상 영역 단위로 움직임 벡터 해상도를 적응적으로 결정하는 것으로 선택된 경우, 디폴트 움직임 벡터 해상도 및 상기 대체 해상도 중에서 하나를 상기 현재블록의 움직임 벡터 해상도로서 결정하는 단계를 포함하는 것을 특징으로 하는 영상 부호화 방법.
  5. 제1항에 있어서, 상기 정보를 부호화하는 단계는,
    상기 현재블록의 움직임 벡터 해상도와 상기 현재블록의 부호화 이전에 부호화된 블록의 움직임 벡터 해상도 사이의 차이값을 상기 현재블록의 움직임 벡터 해상도에 관한 정보의 한 요소로서 부호화하는 단계를 포함하는 것을 특징으로 하는 영상 부호화 방법.
  6. 제3항에 있어서, 상기 정보를 부호화하는 단계는,
    상기 현재블록의 움직임 벡터 해상도와 상기 대체 해상도 사이의 차이값을 상기 현재블록의 움직임 벡터 해상도에 관한 정보의 한 요소로서 부호화하는 단계를 포함하는 것을 특징으로 하는 영상 부호화 방법.
  7. 제1항에 있어서, 상기 정보를 부호화하는 단계는,
    상기 현재블록의 움직임 벡터 해상도와 상기 현재블록의 부호화 이전에 부호화된 블록의 움직임 벡터 해상도 사이의 비율에 대한 정보를 상기 현재블록의 움직임 벡터 해상도에 관한 정보의 한 요소로서 부호화하는 것을 특징으로 하는 영상 부호화 방법.
  8. 적응적으로 현재블록의 움직임 벡터 해상도를 결정하여 상기 현재블록을 복호화하는 방법에 있어서,
    상기 현재블록의 움직임 벡터 해상도에 관한 정보를 비트스트림으로부터 추출하고 상기 현재블록의 움직임 벡터 해상도에 관한 정보에 기초하여 상기 현재블록의 움직임 벡터 해상도를 결정하는 단계; 및
    상기 현재블록의 움직임 벡터 해상도에 따라 결정되는 상기 현재블록의 움직임 벡터를 이용하여 상기 현재블록을 예측하고 복호화하는 단계
    를 포함하는 것을 특징으로 하는 영상 복호화 방법.
  9. 제8항에 있어서, 상기 현재블록의 움직임 벡터 해상도를 결정하는 단계는,
    상위 레벨 영상 영역 단위로 움직임 벡터 해상도를 적응적으로 결정하는지 여부를 나타내는 제1 식별정보를 상기 현재블록의 움직임 벡터 해상도에 관한 정보로서 상기 비트스트림으로부터 추출하고,
    상기 상위 레벨 영상 영역 단위로 움직임 벡터 해상도를 적응적으로 결정하지 않음을 상기 제1 식별정보가 지시하는 경우, 디폴트 움직임 벡터 해상도를 상기 현재블록의 움직임 벡터 해상도로서 결정하는 단계를 포함하는 것을 특징으로 하는 영상 복호화 방법.
  10. 제9항에 있어서, 상기 현재블록의 움직임 벡터 해상도를 결정하는 단계는,
    상기 상위 레벨 영상 영역 단위로 움직임 벡터 해상도를 적응적으로 결정함을 상기 제1 식별정보가 지시하는 경우, 대체 해상도를 상기 현재블록의 움직임 벡터 해상도로서 결정하는 것을 특징으로 하는 영상 복호화 방법.
  11. 제10항에 있어서, 상기 현재블록의 움직임 벡터 해상도를 결정하는 단계는,
    상기 대체 해상도에 관한 정보를 상기 비트스트림으로부터 추출하는 단계를 포함하는 것을 특징으로 하는 영상 복호화 방법.
  12. 제10항에 있어서, 상기 현재블록의 움직임 벡터 해상도를 결정하는 단계는,
    상기 현재블록의 움직임 벡터 해상도를 적응적 방법으로 결정하는지 여부를 지시하는 제2 식별정보를 상기 비트스트림으로부터 추출하는 단계, 및
    상기 현재블록의 움직임 벡터 해상도가 상기 적응적 방법으로 결정됨을 상기 제2 식별정보가 지시하는 경우에, 상기 제2 식별정보에 따라 상기 디폴트 움직임 벡터 해상도 및 상기 대체 해상도 중에서 하나를 상기 현재블록의 움직임 벡터 해상도로서 결정하는 단계를 포함하는 것을 특징으로 하는 영상 복호화 방법.
  13. 제8항에 있어서, 상기 현재블록의 움직임 벡터 해상도를 결정하는 단계는,
    상기 현재블록의 움직임 벡터 해상도와 상기 현재블록의 부호화 이전에 부호화된 블록의 움직임 벡터 해상도 사이의 차이값에 대한 정보를 상기 움직임 벡터 해상도에 관한 정보의 한 요소로서 상기 비트스트림으로부터 추출하는 단계를 포함하는 것을 특징으로 하는 영상 복호화 방법.
  14. 제8항에 있어서, 상기 현재블록의 움직임 벡터 해상도를 결정하는 단계는,
    상기 현재블록의 움직임 벡터 해상도와 상기 현재블록의 부호화 이전에 부호화된 블록의 움직임 벡터 해상도 사이의 비율에 대한 정보를 상기 현재블록의 움직임 벡터 해상도에 관한 정보의 한 요소로서 상기 비트스트림으로부터 추출하는 단계를 포함하는 것을 특징으로 하는 영상 복호화 방법.
  15. 적응적으로 현재블록의 움직임 벡터 해상도를 결정하여 상기 현재블록을 복호화하는 장치에 있어서,
    상기 현재블록의 움직임 벡터 해상도에 관한 정보를 비트스트림으로부터 추출하고 상기 현재블록의 움직임 벡터 해상도에 관한 정보에 기초하여 상기 현재블록의 움직임 벡터 해상도를 결정하는 움직임 벡터 해상도 복호화기; 및
    상기 현재블록의 움직임 벡터 해상도에 따라 결정되는 상기 현재블록의 움직임 벡터를 이용하여 상기 현재블록을 예측하고 복호화하는 영상 복호화기
    를 포함하는 것을 특징으로 하는 영상 복호화 장치.
PCT/KR2017/011484 2016-10-19 2017-10-17 영상 부호화 또는 복호화를 위한 장치 및 방법 WO2018074825A1 (ko)

Priority Applications (7)

Application Number Priority Date Filing Date Title
CN202310713793.0A CN116567209A (zh) 2016-10-19 2017-10-17 视频编码/解码设备和方法及非暂时性记录介质
US16/343,164 US10924757B2 (en) 2016-10-19 2017-10-17 Apparatus and method for encoding or decoding video
CN202310713813.4A CN116567211A (zh) 2016-10-19 2017-10-17 视频编码/解码设备和方法及非暂时性记录介质
CN202310710814.3A CN116567208A (zh) 2016-10-19 2017-10-17 视频编码/解码设备和方法及非暂时性记录介质
CN201780064071.XA CN109845258B (zh) 2016-10-19 2017-10-17 用于对图像进行编码或解码的设备和方法
CN202310713804.5A CN116567210A (zh) 2016-10-19 2017-10-17 视频编码/解码设备和方法及非暂时性记录介质
US17/141,691 US11962798B2 (en) 2016-10-19 2021-01-05 Apparatus and method for encoding or decoding video using adaptive motion vector resolution

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR10-2016-0136066 2016-10-19
KR20160136066 2016-10-19
KR1020170025673A KR20180043151A (ko) 2016-10-19 2017-02-27 영상 부호화 또는 복호화를 위한 장치 및 방법
KR10-2017-0025673 2017-02-27

Related Child Applications (2)

Application Number Title Priority Date Filing Date
US16/343,164 A-371-Of-International US10924757B2 (en) 2016-10-19 2017-10-17 Apparatus and method for encoding or decoding video
US17/141,691 Continuation US11962798B2 (en) 2016-10-19 2021-01-05 Apparatus and method for encoding or decoding video using adaptive motion vector resolution

Publications (1)

Publication Number Publication Date
WO2018074825A1 true WO2018074825A1 (ko) 2018-04-26

Family

ID=62019191

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2017/011484 WO2018074825A1 (ko) 2016-10-19 2017-10-17 영상 부호화 또는 복호화를 위한 장치 및 방법

Country Status (2)

Country Link
CN (4) CN116567210A (ko)
WO (1) WO2018074825A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11736692B2 (en) 2018-12-21 2023-08-22 Samsung Electronics Co., Ltd. Image encoding device and image decoding device using triangular prediction mode, and image encoding method and image decoding method performed thereby

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100704626B1 (ko) * 2005-02-07 2007-04-09 삼성전자주식회사 다 계층 기반의 모션 벡터를 압축하는 방법 및 장치
US20130182760A1 (en) * 2010-09-30 2013-07-18 Panasonic Corporation Image decoding method, image coding method, image decoding apparatus, image coding apparatus, program, and integrated circuit
KR101441874B1 (ko) * 2009-08-21 2014-09-25 에스케이텔레콤 주식회사 적응적 움직임 벡터 해상도를 이용한 영상 부호화/복호화 방법 및 장치
KR20150090194A (ko) * 2013-01-30 2015-08-05 인텔 코포레이션 차세대 비디오 코팅용 콘텐츠 적응적 예측 거리 분석기 및 계층적 움직임 추정 시스템
KR20160106617A (ko) * 2014-01-09 2016-09-12 퀄컴 인코포레이티드 비디오 코딩을 위한 적응 모션 벡터 해상도 시그널링

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100704626B1 (ko) * 2005-02-07 2007-04-09 삼성전자주식회사 다 계층 기반의 모션 벡터를 압축하는 방법 및 장치
KR101441874B1 (ko) * 2009-08-21 2014-09-25 에스케이텔레콤 주식회사 적응적 움직임 벡터 해상도를 이용한 영상 부호화/복호화 방법 및 장치
US20130182760A1 (en) * 2010-09-30 2013-07-18 Panasonic Corporation Image decoding method, image coding method, image decoding apparatus, image coding apparatus, program, and integrated circuit
KR20150090194A (ko) * 2013-01-30 2015-08-05 인텔 코포레이션 차세대 비디오 코팅용 콘텐츠 적응적 예측 거리 분석기 및 계층적 움직임 추정 시스템
KR20160106617A (ko) * 2014-01-09 2016-09-12 퀄컴 인코포레이티드 비디오 코딩을 위한 적응 모션 벡터 해상도 시그널링

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11736692B2 (en) 2018-12-21 2023-08-22 Samsung Electronics Co., Ltd. Image encoding device and image decoding device using triangular prediction mode, and image encoding method and image decoding method performed thereby

Also Published As

Publication number Publication date
CN116567211A (zh) 2023-08-08
CN116567208A (zh) 2023-08-08
CN116567210A (zh) 2023-08-08
CN116567209A (zh) 2023-08-08

Similar Documents

Publication Publication Date Title
WO2017018664A1 (ko) 인트라 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
WO2018030599A1 (ko) 인트라 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
WO2018062892A1 (ko) 가중치 인덱스에 기초하여 최적의 예측을 수행하는 방법 및 장치
WO2017026681A1 (ko) 비디오 코딩 시스템에서 인터 예측 방법 및 장치
WO2018047995A1 (ko) 인트라 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
WO2020071616A1 (ko) Cclm에 기반한 인트라 예측 방법 및 그 장치
WO2012005520A2 (en) Method and apparatus for encoding video by using block merging, and method and apparatus for decoding video by using block merging
WO2011068360A2 (ko) 고해상도 영상의 부호화/복호화 방법 및 이를 수행하는 장치
WO2020050685A1 (ko) 인트라 예측을 이용한 영상 부호화/복호화 방법 및 장치
WO2018124333A1 (ko) 인트라 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
WO2019221465A1 (ko) 영상 복호화 방법/장치, 영상 부호화 방법/장치 및 비트스트림을 저장한 기록 매체
WO2017069505A1 (ko) 영상의 부호화/복호화 방법 및 이를 위한 장치
WO2019182295A1 (ko) 비디오 신호 처리 방법 및 장치
WO2018131986A1 (ko) 영상의 부호화/복호화 방법 및 장치
WO2016190627A1 (ko) 비디오 신호 처리 방법 및 장치
WO2017034113A1 (ko) 인터 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
WO2020096427A1 (ko) 영상 신호 부호화/복호화 방법 및 이를 위한 장치
WO2020055169A1 (ko) 인터 예측을 이용한 영상 부호화/복호화 방법 및 장치
WO2018174457A1 (ko) 영상 처리 방법 및 이를 위한 장치
WO2020180166A1 (ko) 영상 부호화/복호화 방법 및 장치
WO2019190199A1 (ko) 비디오 신호 처리 방법 및 장치
WO2019194647A1 (ko) 필터 정보 기반의 적응적 루프 필터링 방법, 그를 이용한 영상 부호화 및 복호화 방법
WO2020159199A1 (ko) 영상 신호 부호화/복호화 방법 및 이를 위한 장치
WO2011021914A2 (ko) 적응적 움직임 벡터 해상도를 이용한 영상 부호화/복호화 방법 및 장치
WO2019017673A1 (ko) 부호화 방법 및 그 장치, 복호화 방법 및 그 장치

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17862553

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 17862553

Country of ref document: EP

Kind code of ref document: A1