WO2012011672A2 - 확장된 스킵모드를 이용한 영상 부호화/복호화 방법 및 장치 - Google Patents

확장된 스킵모드를 이용한 영상 부호화/복호화 방법 및 장치 Download PDF

Info

Publication number
WO2012011672A2
WO2012011672A2 PCT/KR2011/004521 KR2011004521W WO2012011672A2 WO 2012011672 A2 WO2012011672 A2 WO 2012011672A2 KR 2011004521 W KR2011004521 W KR 2011004521W WO 2012011672 A2 WO2012011672 A2 WO 2012011672A2
Authority
WO
WIPO (PCT)
Prior art keywords
block
motion vector
backward
mode
current block
Prior art date
Application number
PCT/KR2011/004521
Other languages
English (en)
French (fr)
Other versions
WO2012011672A3 (ko
Inventor
송진한
임정연
김용구
최윤식
최영호
김성제
Original Assignee
에스케이텔레콤 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에스케이텔레콤 주식회사 filed Critical 에스케이텔레콤 주식회사
Priority to CN2011800457098A priority Critical patent/CN103141093A/zh
Priority to US13/811,602 priority patent/US20130202039A1/en
Publication of WO2012011672A2 publication Critical patent/WO2012011672A2/ko
Publication of WO2012011672A3 publication Critical patent/WO2012011672A3/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/567Motion estimation based on rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness

Definitions

  • An embodiment of the present invention relates to a method and apparatus for image encoding / decoding using an extended skip mode. More specifically, when performing block-based motion prediction in a video data compression apparatus, redundancy between the current block and the reference image data can be applied by enabling a skip mode in one direction by using the data of the decoded reference image.
  • the present invention relates to a method and apparatus for encoding / decoding using an extended skip mode for further improving the performance of video data compression by efficiently removing the same to obtain better reconstructed picture quality at the same bit rate.
  • a mode in which no data (quantized transform coefficients, motion vectors, etc.) are transmitted except the mode information is defined as a skip mode.
  • the skip mode in H.264 / AVC may be divided into a case of a P slice and a case of a B slice.
  • motion compensation is performed by selecting the reference frame closest to L0 (List 0), which is a reference frame buffer, by using the median of the motion vector of the neighboring block of the current block E.
  • L0 which is a reference frame buffer
  • Skip mode in B slices can occur in two cases depending on the DIRECT mode.
  • the DIRECT mode is a temporal direct mode
  • a motion vector of a -located block is used to predict a motion vector of the current block.
  • the motion compensation is performed by the weighted sum of two blocks indicated by the two prediction motion vectors thus obtained, and likewise, no additional information about the residual signal or the motion vector is sent.
  • the DIRECT mode is a spatial direct mode
  • two motion vectors are generated by using the L0 and L1 motion vectors of neighboring blocks A, B, and C of the current block E, similar to the SKIP mode of a P slice.
  • the motion compensation of the current block is performed by adding the weights of the indicated blocks, and the encoder does not send additional information other than the mode information.
  • both the temporal and spatial direct prediction modes refer to two motion vectors, and thus the motion block most similar to the current block. It is structured to generate.
  • an embodiment of the present invention provides a skip mode in one direction by using data of a decoded reference image when performing block-based motion prediction in a video data compression apparatus.
  • the purpose of the present invention is to improve compression efficiency by efficiently removing redundancy between blocks and reference image data.
  • the main purpose is to further improve the performance of video data compression to obtain better reconstructed picture quality at the same bit rate.
  • a motion vector of a backward reference block of a neighboring block of a current block is set as a predicted motion vector of the current block, or Set a predictive motion vector from the forward reference block motion vector of the block in the backward reference picture at the same position as the block, perform the motion compensation using the predicted motion vector, and predict the prediction mode if the result of the motion compensation satisfies the optimal skip condition.
  • An image encoder configured to set and encode the prediction mode; And decoding a prediction mode by decoding the encoded data.
  • a motion vector of a forward reference block in the same direction as the forward reference block motion vector of the block in the backward reference picture at the same position as the current block Predict the current block by using, and if the prediction mode is the backward temporal extended skip mode, the motion vector for the backward reference block in the opposite direction to the forward reference block motion vector of the block in the backward reference picture at the same position as the current block
  • a prediction block is generated by predicting a current block, and when the prediction mode is a backward spatial extended skip mode, image decoding for generating a prediction block by predicting the current block using a motion vector of a backward reference block of a neighboring block of the current block.
  • An image comprising a flag It offers luxury / decryption device.
  • an embodiment of the present invention in the apparatus for encoding an image, the forward reference of the anchor block with reference to the anchor block which is a block in the back reference picture at the same position as the current block If the motion vector for the forward reference block in the same direction as the motion vector for the block is set as the predictive motion vector, the motion compensation is performed using the predicted motion vector, and if the result of the motion compensation satisfies the optimal skip condition, the prediction mode is selected.
  • a mode determiner for setting the forward temporal extended skip mode; And an encoder for encoding the prediction mode.
  • an embodiment of the present invention in the apparatus for encoding an image, the forward reference of the anchor block with reference to the anchor block which is a block in the back reference picture at the same position as the current block Set the motion vector for the backward reference block in the opposite direction to the motion vector for the block as the predicted motion vector, perform motion compensation using the predicted motion vector, and if the result of the motion compensation satisfies the optimal skip condition, the prediction mode is selected.
  • a mode determiner for setting a backward temporal extended skip mode; And an encoder for encoding the prediction mode.
  • the prediction motion vector of the current block is determined from the motion vector of the backward reference block of the neighboring block of the current block;
  • a mode determiner configured to perform motion compensation using the predicted motion vector and to set a prediction mode to a backward spatial extended skip mode if the result of the motion compensation satisfies an optimal skip condition;
  • an encoder for encoding the prediction mode is
  • an apparatus for decoding an image comprising: a decoder for decoding the prediction mode by decoding the encoded data; And if the prediction mode is the forward temporal extended skip mode, the prediction block is predicted by using the motion vector for the forward reference block in the same direction as the forward reference block motion vector of the block in the backward reference frame at the same position as the current block. It provides a video decoding apparatus comprising a predictor for generating a.
  • an apparatus for decoding an image comprising: a decoder for decoding the prediction mode by decoding the encoded data; And if the prediction mode is a backward temporal extended skip mode, the prediction block is predicted by predicting the current block using a motion vector of a forward reference block motion vector of a block in a backward reference frame at the same position as the current block and a backward reference block in the opposite direction. It provides a video decoding apparatus comprising a predictor for generating a.
  • an apparatus for decoding an image comprising: a decoder for decoding the prediction mode by decoding the encoded data; And a predictor configured to predict the current block to generate a predicted block by using a motion vector of a backward reference block of a neighboring block of the current block when the prediction mode is a backward spatial extended skip mode.
  • an embodiment of the present invention in the method for encoding / decoding an image, the motion vector for the backward reference block of the neighboring block of the current block to the predicted motion vector of the current block Set a predicted motion vector from a forward reference block motion vector of a block in a backward reference frame at the same position as the current block, perform motion compensation using the predicted motion vector, and determine the optimal skip condition as a result of the motion compensation. Setting a prediction mode and encoding the prediction mode if satisfied; And decoding a prediction mode by decoding the encoded data.
  • the prediction mode is a forward temporal extended skip mode
  • a motion vector of a forward reference block in the same direction as the forward reference block motion vector of the block in the backward reference frame at the same position as the current block Predict the current block by using, and if the prediction mode is the backward temporal extended skip mode, the motion vector for the backward reference block in the opposite direction to the forward reference block motion vector of the block in the backward reference frame at the same position as the current block
  • Video code characterized in that it comprises Provide / decoding method.
  • an embodiment of the present invention in the method for encoding an image, forward reference in the same direction as the forward reference block motion vector of the block in the backward reference frame at the same position as the current block Setting a motion vector for a block as a predicted motion vector, performing motion compensation using the predicted motion vector, and setting a prediction mode to a forward temporal extended skip mode if the result of the motion compensation satisfies an optimal skip condition; And it provides a video encoding method comprising the step of encoding the prediction mode.
  • the block in the rear reference frame may be a block in the reference frame closest to the current block among all the rear reference frames.
  • the rate-distortion of the forward temporal extended skip mode in consideration of the amount of bits and distortions generated when the current block is predicted and encoded for each of the inter prediction mode candidates in the set of all inter prediction predictable modes including the forward temporal extended skip mode. If the cost is small, it may be determined that the optimal skip condition is satisfied.
  • an embodiment of the present invention to achieve another object of the present invention, in the method for encoding an image, backward reference in the opposite direction to the forward reference block motion vector of the block in the backward reference frame at the same position as the current block Setting a motion vector for a block as a predicted motion vector, performing motion compensation using the predicted motion vector, and setting a prediction mode to a backward temporal extended skip mode if the result of the motion compensation satisfies an optimal skip condition; And it provides a video encoding method comprising the step of encoding the prediction mode.
  • the block in the rear reference frame may be a block in the reference frame closest to the current block among all the rear reference frames.
  • the rate-distortion of the backward temporal extended skip mode in consideration of the amount of bits and distortions generated when the current block is predicted and encoded for each inter prediction mode candidate in the set of all inter prediction predictable modes including the backward temporal extended skip mode. If the cost is small, it may be determined that the optimal skip condition is satisfied.
  • an embodiment of the present invention in the method for encoding an image, the motion vector for the backward reference block of the neighboring block of the current block as the prediction motion vector of the current block Performing motion compensation using the predicted motion vector and setting a prediction mode to a backward spatial extended skip mode if the result of the motion compensation satisfies an optimal skip condition; And it provides a video encoding method comprising the step of encoding the prediction mode.
  • the rate-distortion of the backward spatial extended skip mode in consideration of the amount of bits and distortions generated when the current block is predicted and encoded for each inter prediction mode candidate in the set of all inter prediction predictable modes including the backward spatial extended skip mode. If the cost is small, it may be determined that the optimal skip condition is satisfied.
  • the backward motion vector may be set to a median of backward motion vectors of neighboring blocks of the current block.
  • a method of decoding an image comprising: decoding a prediction mode by decoding encoded data; And if the prediction mode is the forward temporal extended skip mode, the prediction block is predicted by using the motion vector for the forward reference block in the same direction as the forward reference block motion vector of the block in the backward reference frame at the same position as the current block. It provides a video decoding method comprising the step of generating a.
  • a method of decoding an image comprising: decoding a prediction mode by decoding encoded data; And if the prediction mode is a backward temporal extended skip mode, the prediction block is predicted by predicting the current block using a motion vector of a forward reference block motion vector of a block in a backward reference frame at the same position as the current block and a backward reference block in the opposite direction. It provides a video decoding method comprising the step of generating a.
  • a method of decoding an image comprising: decoding a prediction mode by decoding encoded data; And if the prediction mode is a backward spatial extended skip mode, predicting the current block using a motion vector of a backward reference block of a neighboring block of the current block to generate a prediction block.
  • the block in the rear reference frame may be a block in the reference frame closest to the current block among all the rear reference frames.
  • the backward motion vector may be set to a median of backward motion vectors of neighboring blocks of the current block.
  • the present invention enables to apply a skip mode in one direction by using the data of the decoded reference image to efficiently remove and compress redundancy between the current block and the reference image data.
  • the performance of video data compression is further improved, thereby obtaining a better reconstructed picture quality at the same bit rate.
  • FIG. 1 is a block diagram schematically illustrating a video encoding apparatus according to an embodiment of the present invention.
  • FIG. 2 is a diagram illustrating the positional relationship between the current block, the front reference frame L0 and the rear reference frame L1 of the current block.
  • 3 is a diagram illustrating a predicted motion vector in the forward temporal extended skip mode.
  • FIG. 4 is a diagram illustrating a predicted motion vector in a backward temporal extended skip mode.
  • FIG. 5 is a diagram illustrating a positional relationship between a current block and a neighboring block.
  • FIG. 6 is a block diagram schematically illustrating a configuration of an image decoding apparatus according to an embodiment of the present invention.
  • FIG. 7 is a flowchart illustrating an image encoding method according to a first embodiment of the present invention.
  • FIG. 8 is a flowchart illustrating an image encoding method according to a second embodiment of the present invention.
  • FIG. 9 is a flowchart illustrating a video encoding method according to a third embodiment of the present invention.
  • FIG. 10 is a flowchart illustrating an image decoding method according to an embodiment of the present invention.
  • a video encoding apparatus (Video Encoding Apparatus), a video decoding apparatus (Video Decoding Apparatus) to be described below is a personal computer (PC), notebook computer, personal digital assistant (PDA), portable multimedia player (PMP) : User terminal such as Portable Multimedia Player (PSP), PlayStation Portable (PSP: PlayStation Portable), Wireless Communication Terminal, Smart Phone, or a server terminal such as an application server or a service server.
  • a communication device such as a communication modem for communicating with a wired / wireless communication network, a memory for storing various programs and data for encoding or decoding an image or inter / intra prediction for encoding or decoding, and executing and controlling a program.
  • a variety of cabinets with microprocessors Can mean.
  • the image encoded in the bitstream by the video encoding apparatus is real-time or non-real-time through the wired or wireless communication network, such as the Internet, local area wireless communication network, wireless LAN network, WiBro network, mobile communication network, or the like, or a cable, universal serial bus (USB: Universal) It may be transmitted to an image decoding apparatus through various communication interfaces such as a serial bus, and may be decoded by the image decoding apparatus to restore and reproduce the image.
  • wired or wireless communication network such as the Internet, local area wireless communication network, wireless LAN network, WiBro network, mobile communication network, or the like, or a cable, universal serial bus (USB: Universal) It may be transmitted to an image decoding apparatus through various communication interfaces such as a serial bus, and may be decoded by the image decoding apparatus to restore and reproduce the image.
  • USB universal serial bus
  • a video is composed of a series of pictures, and each picture may be divided into a predetermined area such as a frame or a block.
  • the divided blocks may be classified into intra blocks and inter blocks according to an encoding method.
  • An intra block refers to a block that is encoded by using an intra prediction coding scheme. Intra prediction coding is performed by using pixels of blocks that have been previously encoded, decoded, and reconstructed in a current picture that performs current encoding. A prediction block is generated by predicting pixels of a block, and a difference value with pixels of the current block is encoded.
  • An inter block refers to a block that is encoded using inter prediction coding.
  • Inter prediction coding generates a prediction block by predicting a current block in a current picture by referring to one or more past pictures or future pictures, and then generates a current block. This is a method of encoding the difference value with.
  • a frame referred to for encoding or decoding the current picture is called a reference frame, and a picture including the reference frame is called a reference picture.
  • FIG. 1 is a block diagram schematically illustrating a video encoding apparatus according to an embodiment of the present invention.
  • the image encoding apparatus 100 includes a mode determiner 110, a predictor 120, a subtractor 130, a transformer 140, a scanner 150, an encoder.
  • the encoder 160 may include an encoder 160, an inverse transformer 170, an adder 180, and a filter 190.
  • the input image to be encoded may be input in block units, and the block may be a macroblock.
  • the shape of the macroblock may be various forms of M ⁇ N, where M and N may be natural numbers having a value of 2 n (where n is an integer of 1 or more).
  • different types of blocks may be used for each frame to be encoded.
  • information about a block type that is, information about the block type, is encoded for each frame, thereby encoding the encoded data in the image decoding apparatus.
  • the shape of a block of a frame to be decoded may be determined.
  • the image encoding apparatus 100 may further include a block type determiner (not shown) that determines the block type and encodes information about the block type in the encoded data.
  • a block type determiner (not shown) that determines the block type and encodes information about the block type in the encoded data.
  • the mode determiner 110 may select one of a set of prediction modes and set the prediction mode.
  • the set of prediction modes used in the image encoding apparatus 100 may include at least one of a forward temporal extended skip mode, a backward temporal extended skip mode, and a backward spatial extended skip mode.
  • the encoder 160 encodes the prediction mode determined by the mode determiner 110. Data for the encoded prediction mode may be transmitted to the image decoder.
  • FIG. 2 is a diagram illustrating the positional relationship between the current block, the front reference frame L0 and the rear reference frame L1 of the current block.
  • the mode determiner 110 may determine a block (anchor) in a backward reference picture (or a backward reference frame) at the same position as the current block. Block), set the motion vector for the forward reference block in the same direction as the motion vector (MV) for the forward reference block of the anchor block as the predictive motion vector, and use the set predictive motion vector to compensate for the motion compensation. If the result of motion compensation satisfies the optimal skip condition, the prediction mode is set to the forward temporal extended skip mode.
  • the optimal skip condition is a rate-distortion cost of the forward temporal extended skip mode in consideration of the amount of bits and distortions generated when the current block is predicted and encoded for each of the inter prediction mode candidates in the set of all inter prediction modes.
  • the prediction mode is set to the forward temporal extended skip mode.
  • the mode determiner 110 forwards a motion vector of a forward reference block of the same position block that is a block in a backward reference frame L1 or List 1 having the same position as the position in the current frame of the current block.
  • the forward motion vector MV L0 (that is, the motion vector for the forward reference block) having the same direction as the MV is set as the predicted motion vector. If the motion compensation is performed using the predicted motion vector set here and the result of the motion compensation satisfies the optimal skip condition, the prediction mode of the current block is set to the forward temporal extended skip mode.
  • the mode determiner 110 selects a block (referred to as an anchor block) in a backward reference frame at the same position as the current block.
  • the motion vector MV for the forward reference block of the anchor block and the backward motion vector MV L1 in the opposite direction are set as the prediction motion vectors.
  • the prediction mode is set to the reverse temporal extended skip mode.
  • Rate-distortion of the backward temporal extended skip mode in consideration of the amount of bits and distortions generated when the current block is predicted and encoded for each inter prediction mode candidate in all the inter prediction predictable mode sets including the backward temporal extended skip mode. If the cost is small, it may be determined that the optimal skip condition is satisfied. In this case, the prediction mode is set as the reverse temporal extended skip mode.
  • the forward motion vector MV L0 and the backward motion vector MV L1 of the current block can be obtained from Equation 1.
  • TR B is a time interval between the reference picture (L0) and the current encoding target picture (current picture)
  • TR D is a time interval between the reference picture (L0) and the back reference picture.
  • the block in the rear reference frame may be a block in the reference frame closest to the current picture among all the rear reference frames.
  • FIG. 3 is a diagram illustrating a predicted motion vector in the forward temporal extended skip mode
  • FIG. 4 is a diagram illustrating a predicted motion vector in the backward temporal extended skip mode.
  • FIG. 5 is a diagram illustrating a positional relationship between a current block and a neighboring block.
  • the mode determiner 110 may include neighboring blocks of the current block E (eg, A (left block), Determine the predicted motion vector of the current block E from the rear motion vectors of B (upper block) and C (right upper block), perform motion compensation using the determined predicted motion vector, and optimally skip the result of the motion compensation. If the condition is satisfied, the prediction mode is set to the backward spatial extended skip mode.
  • the neighboring blocks of the current block E are not limited to A, B, and C, and may be A, B, C, or D (left upper block).
  • Rate-distortion of the backward spatial extended skip mode in consideration of the amount of bits and distortions generated when the current block is predicted and encoded for each inter prediction mode candidate in the set of all interpredictable modes including the backward spatial extended skip mode. If the cost is small, it may be determined that the optimal skip condition is satisfied. In this case, the prediction mode is set to the backward spatial extended skip mode.
  • the predicted motion vector may be set as a median of backward motion vectors of neighboring blocks A, B, and C of the current block, but the present invention is not limited thereto, and the neighboring block may be determined in various ways.
  • the predicted motion vector can be calculated from various backward motion vectors of the neighboring blocks.
  • the horizontal component of the prediction motion vector may be calculated from the horizontal component of the backward motion vector of the neighboring blocks A, B, and C, and the vertical component of the prediction motion vector is the backward motion of the neighboring blocks A, B, and C. Can be calculated from the vertical components of the vector.
  • the predictor 120 generates a prediction block by predicting the current block. That is, the predictor 120 predicts a pixel value of each pixel of the current block to be encoded in the image to generate a predicted block having a predicted pixel value of each pixel predicted. do.
  • the predictor 120 may predict the current block by using intra prediction or inter prediction.
  • the prediction mode is one of the forward temporal extended skip mode, the backward temporal extended skip mode, and the backward spatial extended skip mode, the predictor 120 does not generate the predictive block.
  • the subtractor 130 subtracts the prediction block from the current block to generate a residual block. That is, the subtractor 130 calculates a difference between the pixel value of each pixel of the current block to be encoded and the predicted pixel value of each pixel of the prediction block predicted by the predictor 120 to obtain a residual signal in the form of a block. Creates a residual block with
  • the quantization process may include a transform process.
  • the transform is completed when the quantization is completed.
  • the transform method includes a spatial signal such as a Hadamard transform and a discrete cosine transform based integer transform (hereinafter, referred to as an integer transform) to the frequency domain. Transformation techniques may be used, and various quantization techniques such as Dead Zone Uniform Threshold Quantization (DZUTQ) or Quantization Weighted Matrix (DZUTQ) are used as quantization schemes. Can be.
  • DZUTQ Dead Zone Uniform Threshold Quantization
  • DZUTQ Quantization Weighted Matrix
  • the scanner 150 scans the coefficients of the color space prediction block generated by the converter 140 to generate a coefficient sequence.
  • the scanning method considers characteristics of a transform technique, a quantization technique, and a block (macroblock or subblock), and the scanning order may be determined such that the scanned coefficient sequence has a minimum length.
  • the scanner 150 is illustrated and described as being implemented independently of the encoder 160, but the scanner 150 may be omitted, and its function may be integrated into the encoder 160.
  • the encoder 160 may include not only the prediction mode but also various pieces of information necessary to decode the encoded bit string in the encoded data.
  • the various pieces of information necessary for decoding the encoded bit string may be various pieces of information such as information on a block type.
  • the inverse transformer 170 reconstructs the residual block by performing an inverse transform on the transformed residual block generated by the transformer 140. If the quantization is also performed in the transformer 140, the inverse transformer 170 performs inverse transform after inverse quantization, and may be performed by inversely performing a transform process and a quantization process performed by the transformer 140.
  • the adder 180 reconstructs the current block by adding the prediction block predicted by the predictor 120 and the residual block generated by the inverse transformer 170.
  • the filter 190 filters the current block reconstructed by the adder 180.
  • the filter 190 reduces blocking effects occurring at the block boundary or the transform boundary by transformation and quantization of the block unit of the image.
  • the subtractor 130, the converter 140, the scanner 150, the inverse transformer 170, and the adder ( 180, filter 190 may not work.
  • FIG. 6 is a block diagram schematically illustrating a configuration of an image decoding apparatus according to an embodiment of the present invention.
  • the image decoding apparatus 600 includes a decoder 610, an inverse scanner 620, an inverse transformer 630, an adder 640, a predictor 650, and a filter 660.
  • a decoder 610 receives a coded bit stream from a decoded data stream from a decoded data stream.
  • the inverse scanner 620 and the filter 660 are not necessarily included, and may be optionally omitted depending on the implementation manner.
  • the inverse scanner 620 is omitted, the function is integrated in the decoder 610. Can be implemented.
  • the decoder 610 decodes the encoded data to decode the prediction mode.
  • the decoder 610 may rescan the encoded data to restore the transformed residual block.
  • the decoder 610 may decode and extract encoded data to decode or extract information necessary for decoding as well as a color space prediction block.
  • the information necessary for decoding refers to information necessary for decoding the coded bit string in the encoded data. For example, information about a block type, information about an intra prediction mode when the prediction mode is an intra prediction mode, and an inter prediction mode In the case of the prediction mode, the information may be information on a motion vector, information on a transform and quantization type, or the like.
  • information about the block type may be transmitted to the inverse transformer 630 and the predictor 650, and information about a transform type (or a transform and quantization type) may be transferred to the inverse transformer 630.
  • information necessary for prediction such as information about a prediction mode and information about a motion vector, may be transmitted to the predictor 650.
  • the inverse scanner 620 restores the transform coefficient sequence decoded by the decoder 610 and restores the prediction block by reverse scanning the transform coefficient sequence.
  • the inverse scanner 620 inversely scans the extracted coefficient sequence by various inverse scanning methods such as inverse zigzag scan to generate a color space prediction block.
  • the inverse scanning method may obtain information about the size of the transform from the decoder 610 and generate a residual block by using an inverse scanning method corresponding thereto.
  • the inverse transformer 630 inversely transforms the transformed residual block to be recovered to restore the residual block.
  • the inverse transformer 630 may inversely transform the residual block transformed according to the transformation type.
  • the method of inversely transforming the transformed residual block according to the transform type by the inverse transformer 630 is the same as or similar to inversely performing the process of transforming the transformed block according to the transform type in the converter 140 of the image encoding apparatus 100. Therefore, detailed description of the inverse transform method is omitted.
  • the predictor 650 predicts the current block to generate a predicted block.
  • the predictor 650 determines the size and shape of the current block according to the block type identified by the information on the block type, and predicts the current block by using an intra prediction mode or a motion vector identified by the information required for prediction.
  • a prediction block can be generated.
  • the predictor 650 is the same or similar to the predictor 120 of the image encoding apparatus 100.
  • the predictor 650 divides the current block into subblocks and combines the prediction subblocks generated by predicting the divided subblocks to predict the blocks. Can be generated.
  • the adder 640 reconstructs the current block by adding the residual block reconstructed by the inverse transformer 630 and the predictive block generated by the predictor 650.
  • the filter 660 filters the current block reconstructed by the adder 640, and the reconstructed filtered current block is accumulated in units of pictures and stored in a memory (not shown) as a reference picture to be stored in the next block or in the predictor 650. It can be used when predicting the next picture.
  • the filter 190 of the image encoding apparatus 100 is the same as or similar to that of the deblocking filtering, and thus the detailed description of the filtering method is omitted.
  • the prediction mode is one of the forward temporal extended skip mode, the backward temporal extended skip mode, and the reverse spatial extended skip mode
  • the inverse scanner 620, the inverse transformer 630, the adder 640, and the filter 660 are operated. You can't.
  • the predictor 650 predicts the current block by using the forward motion vector of the same direction as the forward reference block motion vector of the block in the backward reference frame at the same position as the current block. Create a block. I.e., obtain the current block is forward motion vector (MV L0) in the equation (1), such as to produce a forward motion vector (MV L0) the block indicated (see Fig. 3) to the prediction block. Meanwhile, since the information about the pixels of the residual block is not transmitted from the image encoder 100, the prediction block generated here becomes a reconstruction block.
  • the predictor 650 predicts the current block by using the backward motion vector of the block in the opposite direction to the forward reference block motion vector of the block in the backward reference frame at the same position as the current block. Create a block. I.e., obtain the current block is a backward motion vector (MV L1) of as shown in Equation 1, it produces the backward motion vector (MV L1) block is pointing (see Fig. 4) as a prediction block. Meanwhile, since the information about the pixels of the residual block is not transmitted from the image encoder 100, the prediction block generated here becomes a reconstruction block.
  • the block in the rear reference frame may be a block in the reference frame closest to the current block among all the rear reference frames.
  • the predictor 650 predicts the current block using the backward motion vector of the neighboring block of the current block to generate the predicted block. That is, the median of the backward motion vectors of the neighboring blocks A, B, and C of the current block as shown in FIG. 5 may be set as the predicted motion vector, but the present invention is not limited thereto and the neighboring block may be determined in various ways. In addition, the predicted motion vector may be calculated from various backward methods from the backward motion vector of the neighboring block.
  • the horizontal component of the prediction motion vector may be calculated from the horizontal component of the backward motion vector of the neighboring blocks A, B, and C
  • the vertical component of the prediction motion vector is the backward motion of the neighboring blocks A, B, and C. Can be calculated from the vertical components of the vector.
  • the backward motion vector may be set to a median value of backward motion vectors of neighboring blocks of the current block.
  • the image encoding / decoding apparatus may be implemented by combining the image encoding apparatus 100 of FIG. 1 and the image decoding apparatus 600 of FIG. 6.
  • the image encoding / decoding apparatus sets the backward motion vector of the neighboring block of the current block as the predicted motion vector of the current block or the forward reference block motion vector of the block in the backward reference frame at the same position as the current block.
  • a video encoder (the video encoding apparatus 100) configured to set a predictive motion vector, perform a motion compensation using the predictive motion vector, and set a prediction mode and encode the prediction mode when the result of the motion compensation satisfies an optimal skip condition. And decoding the prediction mode by decoding the encoded data, and if the prediction mode is the forward temporal extended skip mode, the forward direction in the same direction as the forward reference block motion vector of the block in the backward reference frame at the same position as the current block.
  • the prediction block is generated by predicting the current block using the backward motion vector of the block in the opposite direction to the forward reference block motion vector of the block in the backward reference frame at the same position as the current block.
  • the extended skip mode includes an image decoder (which may be implemented using the image decoding apparatus 600) that predicts the current block using the backward motion vector of the neighboring block of the current block to generate the prediction block.
  • FIG. 7 is a flowchart illustrating an image encoding method according to a first embodiment of the present invention.
  • a forward motion vector in the same direction as a motion vector of a forward reference block of an anchor block with reference to a block (anchor block) in a rear reference frame at the same position as the current block.
  • the predictive motion vector S702
  • the method may include encoding a prediction mode in operation S808.
  • the block in the rear reference frame may be a block in the reference frame closest to the current block among all the rear reference frames.
  • the rate-distortion of the forward temporal extended skip mode in consideration of the amount of bits and distortions generated when the current block is predicted and encoded for each of the inter prediction mode candidates in the set of all inter prediction predictable modes including the forward temporal extended skip mode. If the cost is small, it may be determined that the optimal skip condition is satisfied.
  • FIG. 8 is a flowchart illustrating an image encoding method according to a second embodiment of the present invention.
  • the image encoding method refers to a block (anchor block) in a rear reference frame at the same position as the current block, and performs a backward motion vector in the opposite direction to the motion vector of the forward reference block of the anchor block.
  • the operation may include encoding the prediction mode in operation S808.
  • the block in the rear reference frame may be a block in the reference frame closest to the current block among all the rear reference frames.
  • the rate-distortion of the backward temporal extended skip mode in consideration of the amount of bits and distortions generated when the current block is predicted and encoded for each inter prediction mode candidate in the set of all inter prediction predictable modes including the backward temporal extended skip mode. If the cost is small, it may be determined that the optimal skip condition is satisfied.
  • FIG. 9 is a flowchart illustrating a video encoding method according to a third embodiment of the present invention.
  • the method sets the backward motion vector of the neighboring block of the current block as the predicted motion vector of the current block (S902), and performs motion compensation using the predicted motion vector.
  • the method may include setting the prediction mode to the backward spatial extended skip mode (S906) and encoding the prediction mode (S908).
  • the rate-distortion of the backward spatial extended skip mode in consideration of the amount of bits and distortions generated when the current block is predicted and encoded for each inter prediction mode candidate in the set of all inter prediction predictable modes including the backward spatial extended skip mode. If the cost is small, it may be determined that the optimal skip condition is satisfied.
  • the backward motion vector may be set to a median of backward motion vectors of neighboring blocks of the current block.
  • FIG. 10 is a flowchart illustrating an image decoding method according to an embodiment of the present invention.
  • the video decoding method decodes the encoded data to decode the prediction mode (S1002), determines the prediction mode (S1004), and if the prediction mode is the forward temporal extended skip mode, the same as the current block.
  • the block in the rear reference frame may be a block in the reference frame closest to the current block among all the rear reference frames.
  • the backward motion vector may be set to a median of backward motion vectors of neighboring blocks of the current block.
  • a prediction mode that may be set in an image decoding method according to an embodiment of the present invention does not include a forward temporal extended skip mode. If not, step S1006 may be omitted. If the backward temporal extended skip mode is not included, step S1008 may be omitted. If the backward spatial extended skip mode is not included, step S1010 may be omitted.
  • An image encoding / decoding method includes the image encoding method according to the first to third embodiments of the present invention of FIGS. 7 to 9 and the embodiment of the present invention of FIG. 10. This can be achieved by implementing a combination of video decoding methods.
  • an image encoding / decoding method includes setting a backward motion vector of a neighboring block of a current block as a predicted motion vector of the current block or a forward reference block of a block in a backward reference frame at the same position as the current block. Setting a predictive motion vector from the motion vector, performing motion compensation using the predictive motion vector, setting a prediction mode and encoding a prediction mode if the result of the motion compensation satisfies an optimal skip condition, and decoding the encoded data.
  • the prediction mode is decoded, and if the prediction mode is the forward temporal extended skip mode, the current block is predicted using the forward motion vector in the same direction as the forward reference block motion vector of the block in the backward reference frame at the same position as the current block. Is equal to the current block if backward temporal extended skip mode
  • the prediction block is generated by predicting the current block using the backward motion vector of the block in the backward reference frame at the one position in the opposite direction, and when the prediction mode is the backward spatial extended skip mode, the neighboring block of the current block And predicting a current block using a backward motion vector to generate a predicted block.
  • the context of the motion vector is generated based on the motion vector correlation of the neighboring block, and the candidate motion vector is generated as the context of the neighboring block.
  • the present invention enables to apply a skip mode in one direction by using the data of the decoded reference image to efficiently remove and compress redundancy between the current block and the reference image data.
  • it is suitable for obtaining the effect of further improving the performance of video data compression to obtain better reconstructed picture quality at the same bit rate, and thus it is industrially applicable.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 발명의 실시예는 확장된 스킵모드를 이용한 영상 부호화/복호화 방법 및 장치에 관한 것이다. 본 발명의 일 실시예는,현재 블록의 주변블록의 후방 참조블록에 대한 움직임 벡터를 상기 현재 블록의 예측 움직임 벡터로 설정하거나 현재 블록과 동일한 위치의 후방 참조픽처 내의 블록의 전방 참조블록 움직임 벡터로부터 예측 움직임 벡터를 설정하고, 상기 예측 움직임 벡터를 이용하여 움직임 보상을 수행하고 상기 움직임 보상의 결과가 최적 스킵조건을 만족하면 예측모드를 설정하는 단계를 포함하는 영상 부호화/복호화 방법 및 장치를 제공한다.

Description

확장된 스킵모드를 이용한 영상 부호화/복호화 방법 및 장치
본 발명의 실시예는 확장된 스킵모드를 이용한 영상 부호화/복호화 방법 및 장치에 관한 것이다. 더욱 상세하게는, 비디오 데이터의 압축 장치에 있어서 블록 기반 움직임 예측을 수행할 때, 기 복호된 참조 영상의 데이터를 활용하여 단방향에서의 스킵모드를 적용 가능하도록 함으로써 현재 블록과 참조 영상 데이터 간의 중복성을 효율적으로 제거하여 압축 효율을 개선하기 위한 것으로, 비디오 데이터 압축의 성능을 더욱 향상시켜 같은 비트율에서 보다 우수한 복원 화질을 얻고자 하는 확장된 스킵모드를 이용한 영상 부호화/복호화 방법 및 장치에 관한 것이다.
비디오 데이터 압축 장치에 있어서, 종래의 H.264/AVC와 같은 경우는 모드 정보 이외에는 어떠한 데이터(양자화된 변환 계수, 움직임 벡터 등)도 전송하지 않는 모드를 스킵(SKIP) 모드라고 정의한다. H.264/AVC에서의 스킵 모드는 P 슬라이스의 경우와 B 슬라이스의 경우로 구분될 수 있다.
P 슬라이스에서의 스킵모드는 현재 블록 E의 주변 블록의 움직임 벡터의 중앙값(median)을 이용하여 참조 프레임 버퍼인 L0(List 0)에서 가장 가까운 참조 프레임을 선택하여 움직임 보상을 수행하도록 한다. 이와 같이 스킵 모드로 결정된 블록은 움직임 벡터와 잔여 신호를 전송하지 않기 때문에 매우 높은 압축 성능을 제공할 수 있다는 장점을 가진다.
B 슬라이스에서의 스킵모드는 직접예측(DIRECT) 모드에 따라서 두 가지의 경우에 발생할 수 있다. DIRECT 모드가 시간적 직접 예측 모드(Temporal DIRECT mode)일 때는 부호화하고자 하는 현재 B 슬라이스(Current B)와 가장 가까운 List 1(L1)의 참조 프레임에 현재 블록(Current Block)과 동일한 위치에 있는 블록(co-located block)의 움직임 벡터를 이용하여 현재 블록의 움직임 벡터를 예측한다. 이렇게 얻어진 두 개의 예측 움직임 벡터가 가리키는 두 개의 블록의 가중치 합으로 움직임 보상을 수행하고, 마찬가지로 잔여 신호나 움직임 벡터에 대한 부가 정보를 보내지 않는다.
또한, DIRECT 모드가 공간적 직접 예측 모드(Spatial DIRECT mode)일 때는 P 슬라이스에서의 SKIP 모드와 유사하게 현재 블록 E의 주변 블록 A, B, C의 L0, L1 움직임 벡터를 이용하여 두 개의 움직임 벡터가 가리키는 블록의 가중치의 합으로 현재 블록의 움직임 보상을 수행하게 되고, 부호화기에서는 모드정보 이외의 부가 정보를 보내지 않게 된다
B 슬라이스의 스킵모드의 경우는 P 슬라이스의 경우와는 달리 시간적으로 앞/뒤의 참조 프레임을 가질 수 있기 때문에, 시간 및 공간적 직접 예측 모드 모두 두 개의 움직임 벡터를 참조하여 현재 블록과 가장 유사한 움직임 블록을 생성하는 구조로 되어 있다.
하지만, 장면이 변화하거나 객체 또는 카메라가 급격하게 움직이는 경우처럼 두 개의 참조 블록 간의 상관도가 떨어지는 경우는 가중치의 합으로 현재 블록을 근사하기에는 적절하지 않아, 가중치의 합을 통한 움직임 보상은 그 정확도가 떨어질 수 있는 문제점이 있다.
이러한 문제점을 해결하기 위해 본 발명의 실시예는, 비디오 데이터의 압축 장치에 있어서 블록 기반 움직임 예측을 수행할 때, 기 복호된 참조 영상의 데이터를 활용하여 단방향에서의 스킵모드를 적용 가능하도록 함으로써 현재 블록과 참조 영상 데이터 간의 중복성을 효율적으로 제거하여 압축 효율을 개선하기 위한 것으로, 비디오 데이터 압축의 성능을 더욱 향상시켜 같은 비트율에서 보다 우수한 복원 화질을 얻는 데 주된 목적이 있다.
전술한 목적을 달성하기 위해 본 발명의 일 실시예는, 영상을 부호화/복호화하는 장치에 있어서, 현재 블록의 주변블록의 후방 참조블록에 대한 움직임 벡터를 상기 현재 블록의 예측 움직임 벡터로 설정하거나 현재 블록과 동일한 위치의 후방 참조픽처 내의 블록의 전방 참조블록 움직임 벡터로부터 예측 움직임 벡터를 설정하고, 상기 예측 움직임 벡터를 이용하여 움직임 보상을 수행하고 상기 움직임 보상의 결과가 최적 스킵조건을 만족하면 예측모드를 설정하고 상기 예측모드를 부호화하는 영상 부호화기; 및 부호화 데이터를 복호화하여 예측모드를 복호하고, 상기 예측모드가 순방향 시간적 확장스킵 모드이면 현재 블록과 동일한 위치의 후방 참조픽처 내의 블록의 전방 참조블록 움직임 벡터와 동일한 방향의 전방 참조블록에 대한 움직임 벡터를 이용하여 현재 블록을 예측하고, 상기 예측모드가 역방향 시간적 확장스킵 모드이면 현재 블록과 동일한 위치의 후방 참조픽처 내의 블록의 전방 참조블록 움직임 벡터와 정반대 방향의 후방 참조블록에 대한 움직임 벡터를 이용하여 현재 블록을 예측하여 예측 블록을 생성하고, 상기 예측모드가 역방향 공간적 확장스킵 모드이면 현재 블록의 주변블록의 후방 참조블록에 대한 움직임 벡터를 이용하여 상기 현재 블록을 예측하여 예측 블록을 생성하는 영상 복호화기를 포함하는 것을 특징으로 하는 영상 부호화/복호화 장치를 제공한다.
또한, 본 발명의 다른 목적을 달성하기 위해 본 발명의 일 실시예는, 영상을 부호화하는 장치에 있어서, 현재 블록과 동일한 위치의 후방 참조픽처 내의 블록인 앵커블록을 참조하여 상기 앵커블록의 전방 참조블록에 대한 움직임 벡터와 동일한 방향의 전방 참조블록에 대한 움직임 벡터를 예측 움직임 벡터로 설정하고 상기 예측 움직임 벡터를 이용하여 움직임 보상을 수행하고 상기 움직임 보상의 결과가 최적 스킵조건을 만족하면 예측모드를 순방향 시간적 확장스킵 모드로 설정하는 모드결정기; 및 상기 예측모드를 부호화하는 부호화기를 포함하는 것을 특징으로 하는 영상 부호화 장치를 제공한다.
또한, 본 발명의 다른 목적을 달성하기 위해 본 발명의 일 실시예는, 영상을 부호화하는 장치에 있어서, 현재 블록과 동일한 위치의 후방 참조픽처 내의 블록인 앵커블록을 참조하여 상기 앵커블록의 전방 참조블록에 대한 움직임 벡터와 정반대 방향의 후방 참조블록에 대한 움직임 벡터를 예측 움직임 벡터로 설정하고 상기 예측 움직임 벡터를 이용하여 움직임 보상을 수행하고 상기 움직임 보상의 결과가 최적 스킵조건을 만족하면 예측모드를 역방향 시간적 확장스킵 모드로 설정하는 모드결정기; 및 상기 예측모드를 부호화하는 부호화기를 포함하는 것을 특징으로 하는 영상 부호화 장치를 제공한다.
또한, 본 발명의 다른 목적을 달성하기 위해 본 발명의 일 실시예는, 영상을 부호화하는 장치에 있어서, 현재 블록의 주변블록의 후방 참조블록에 대한 움직임 벡터로부터 상기 현재 블록의 예측 움직임 벡터를 결정하고 상기 예측 움직임 벡터를 이용하여 움직임 보상을 수행하고 상기 움직임 보상의 결과가 최적 스킵조건을 만족하면 예측모드를 역방향 공간적 확장스킵 모드로 설정하는 모드결정기; 및 상기 예측모드를 부호화하는 부호화기를 포함하는 것을 특징으로 하는 영상 부호화 장치한다.
또한, 본 발명의 다른 목적을 달성하기 위해 본 발명의 일 실시예는, 영상을 복호화하는 장치에 있어서, 부호화 데이터를 복호화하여 예측모드를 복호하는 복호화기; 및 상기 예측모드가 순방향 시간적 확장스킵 모드이면, 현재 블록과 동일한 위치의 후방 참조프레임 내의 블록의 전방 참조블록 움직임 벡터와 동일한 방향의 전방 참조블록에 대한 움직임 벡터를 이용하여 현재 블록을 예측하여 예측 블록을 생성하는 예측기를 포함하는 것을 특징으로 하는 영상 복호화 장치를 제공한다.
또한, 본 발명의 다른 목적을 달성하기 위해 본 발명의 일 실시예는, 영상을 복호화하는 장치에 있어서, 부호화 데이터를 복호화하여 예측모드를 복호하는 복호화기; 및 상기 예측모드가 역방향 시간적 확장스킵 모드이면, 현재 블록과 동일한 위치의 후방 참조프레임 내의 블록의 전방 참조블록 움직임 벡터와 정반대 방향의 후방 참조블록에 대한 움직임 벡터를 이용하여 현재 블록을 예측하여 예측 블록을 생성하는 예측기를 포함하는 것을 특징으로 하는 영상 복호화 장치를 제공한다.
또한, 본 발명의 다른 목적을 달성하기 위해 본 발명의 일 실시예는, 영상을 복호화하는 장치에 있어서, 부호화 데이터를 복호화하여 예측모드를 복호하는 복호화기; 및 상기 예측모드가 역방향 공간적 확장스킵 모드이면, 현재 블록의 주변블록의 후방 참조블록에 대한 움직임 벡터를 이용하여 상기 현재 블록을 예측하여 예측 블록을 생성하는 예측기를 포함하는 것을 특징으로 하는 영상 복호화 장치를 제공한다.
또한, 본 발명의 다른 목적을 달성하기 위해 본 발명의 일 실시예는, 영상을 부호화/복호화하는 방법에 있어서, 현재 블록의 주변블록의 후방 참조블록에 대한 움직임 벡터를 상기 현재 블록의 예측 움직임 벡터로 설정하거나 현재 블록과 동일한 위치의 후방 참조프레임 내의 블록의 전방 참조블록 움직임 벡터로부터 예측 움직임 벡터를 설정하고, 상기 예측 움직임 벡터를 이용하여 움직임 보상을 수행하고 상기 움직임 보상의 결과가 최적 스킵조건을 만족하면 예측모드를 설정하고 상기 예측모드를 부호화하는 단계; 및 부호화 데이터를 복호화하여 예측모드를 복호하고, 상기 예측모드가 순방향 시간적 확장스킵 모드이면 현재 블록과 동일한 위치의 후방 참조프레임 내의 블록의 전방 참조블록 움직임 벡터와 동일한 방향의 전방 참조블록에 대한 움직임 벡터를 이용하여 현재 블록을 예측하고, 상기 예측모드가 역방향 시간적 확장스킵 모드이면 현재 블록과 동일한 위치의 후방 참조프레임 내의 블록의 전방 참조블록 움직임 벡터와 정반대 방향의 후방 참조블록에 대한 움직임 벡터를 이용하여 현재 블록을 예측하여 예측 블록을 생성하고, 상기 예측모드가 역방향 공간적 확장스킵 모드이면 현재 블록의 주변블록의 후방 참조블록에 대한 움직임 벡터를 이용하여 상기 현재 블록을 예측하여 예측 블록을 생성하는 단계를 포함하는 것을 특징으로 하는 영상 부호화/복호화 방법을 제공한다.
또한, 본 발명의 다른 목적을 달성하기 위해 본 발명의 일 실시예는, 영상을 부호화하는 방법에 있어서, 현재 블록과 동일한 위치의 후방 참조프레임 내의 블록의 전방 참조블록 움직임 벡터와 동일한 방향의 전방 참조블록에 대한 움직임 벡터를 예측 움직임 벡터로 설정하고 상기 예측 움직임 벡터를 이용하여 움직임 보상을 수행하고 상기 움직임 보상의 결과가 최적 스킵조건을 만족하면 예측모드를 순방향 시간적 확장스킵 모드로 설정하는 단계; 및 상기 예측모드를 부호화하는 단계를 포함하는 것을 특징으로 하는 영상 부호화 방법을 제공한다.
여기서, 후방 참조프레임 내의 블록은 모든 후방 참조프레임 중에서 현재 블록과 가장 가까운 참조프레임 내의 블록일 수 있다.
여기서, 순방향 시간적 확장스킵 모드를 포함한 모든 인터예측 가능 모드 집합 내의 인터 예측 모드 후보 각각에 대해 현재 블록을 예측하고 부호화하는 경우에 발생하는 비트량과 왜곡치를 고려하여 순방향 시간적 확장스킵 모드의 율-왜곡 비용이 작은 경우 최적 스킵조건을 만족하는 것으로 판단할 수 있다.
또한, 본 발명의 다른 목적을 달성하기 위해 본 발명의 일 실시예는, 영상을 부호화하는 방법에 있어서, 현재 블록과 동일한 위치의 후방 참조프레임 내의 블록의 전방 참조블록 움직임 벡터와 정반대 방향의 후방 참조블록에 대한 움직임 벡터를 예측 움직임 벡터로 설정하고 상기 예측 움직임 벡터를 이용하여 움직임 보상을 수행하고 상기 움직임 보상의 결과가 최적 스킵조건을 만족하면 예측모드를 역방향 시간적 확장스킵 모드로 설정하는 단계; 및 상기 예측모드를 부호화하는 단계를 포함하는 것을 특징으로 하는 영상 부호화 방법을 제공한다.
여기서, 후방 참조프레임 내의 블록은 모든 후방 참조프레임 중에서 현재 블록과 가장 가까운 참조프레임 내의 블록일 수 있다.
여기서, 역방향 시간적 확장스킵 모드를 포함한 모든 인터예측 가능 모드 집합 내의 인터 예측 모드 후보 각각에 대해 현재 블록을 예측하고 부호화하는 경우에 발생하는 비트량과 왜곡치를 고려하여 역방향 시간적 확장스킵 모드의 율-왜곡 비용이 작은 경우 최적 스킵조건을 만족하는 것으로 판단할 수 있다.
또한, 본 발명의 다른 목적을 달성하기 위해 본 발명의 일 실시예는, 영상을 부호화하는 방법에 있어서, 현재 블록의 주변블록의 후방 참조블록에 대한 움직임 벡터를 상기 현재 블록의 예측 움직임 벡터로 설정하고 상기 예측 움직임 벡터를 이용하여 움직임 보상을 수행하고 상기 움직임 보상의 결과가 최적 스킵조건을 만족하면 예측모드를 역방향 공간적 확장스킵 모드로 설정하는 단계; 및 상기 예측모드를 부호화하는 단계를 포함하는 것을 특징으로 하는 영상 부호화 방법을 제공한다.
여기서, 역방향 공간적 확장스킵 모드를 포함한 모든 인터예측 가능 모드 집합 내의 인터 예측 모드 후보 각각에 대해 현재 블록을 예측하고 부호화하는 경우에 발생하는 비트량과 왜곡치를 고려하여 역방향 공간적 확장스킵 모드의 율-왜곡 비용이 작은 경우 최적 스킵조건을 만족하는 것으로 판단할 수 있다.
여기서, 후방 움직임 벡터는, 현재 블록의 주변블록의 후방 움직임 벡터들의 중앙값으로 설정될 수 있다.
또한, 본 발명의 다른 목적을 달성하기 위해 본 발명의 일 실시예는, 영상을 복호화하는 방법에 있어서, 부호화 데이터를 복호화하여 예측모드를 복호하는 단계; 및 상기 예측모드가 순방향 시간적 확장스킵 모드이면, 현재 블록과 동일한 위치의 후방 참조프레임 내의 블록의 전방 참조블록 움직임 벡터와 동일한 방향의 전방 참조블록에 대한 움직임 벡터를 이용하여 현재 블록을 예측하여 예측 블록을 생성하는 단계를 포함하는 것을 특징으로 하는 영상 복호화 방법을 제공한다.
또한, 본 발명의 다른 목적을 달성하기 위해 본 발명의 일 실시예는, 영상을 복호화하는 방법에 있어서, 부호화 데이터를 복호화하여 예측모드를 복호하는 단계; 및 상기 예측모드가 역방향 시간적 확장스킵 모드이면, 현재 블록과 동일한 위치의 후방 참조프레임 내의 블록의 전방 참조블록 움직임 벡터와 정반대 방향의 후방 참조블록에 대한 움직임 벡터를 이용하여 현재 블록을 예측하여 예측 블록을 생성하는 단계를 포함하는 것을 특징으로 하는 영상 복호화 방법을 제공한다.
또한, 본 발명의 다른 목적을 달성하기 위해 본 발명의 일 실시예는, 영상을 복호화하는 방법에 있어서, 부호화 데이터를 복호화하여 예측모드를 복호하는 단계; 및 상기 예측모드가 역방향 공간적 확장스킵 모드이면, 현재 블록의 주변블록의 후방 참조블록에 대한 움직임 벡터를 이용하여 상기 현재 블록을 예측하여 예측 블록을 생성하는 단계를 포함하는 것을 특징으로 하는 영상 복호화 방법을 제공한다.
여기서, 후방 참조프레임 내의 블록은, 모든 후방 참조프레임 중에서 상기 현재 블록과 가장 가까운 참조프레임 내의 블록일 수 있다.
여기서, 후방 움직임 벡터는, 현재 블록의 주변블록의 후방 움직임 벡터들의 중앙값으로 설정될 수 있다.
이상에서 설명한 바와 같이 본 발명의 실시예에 의하면, 본 발명은 기 복호된 참조 영상의 데이터를 활용하여 단방향에서의 스킵모드를 적용 가능하도록 함으로써 현재 블록과 참조 영상 데이터 간의 중복성을 효율적으로 제거하여 압축 효율을 개선하기 위한 것으로, 비디오 데이터 압축의 성능을 더욱 향상시켜 같은 비트율에서 보다 우수한 복원 화질을 얻는 효과가 있다.
도 1은 본 발명의 일 실시예에 따른 영상 부호화 장치를 간략하게 나타낸 블록 구성도이다.
도 2는 현재 블록 및 현재블록의 전방참조 프레임(L0) 및 후방 참조프레임(L1)의 위치관계를 도시한 도면이다.
도 3은 순방향 시간적 확장스킵 모드에서 예측 움직임 벡터를 도시한 도면이다.
도 4는 역방향 시간적 확장스킵 모드에서 예측 움직임 벡터를 도시한 도면이다.
도 5는 현재 블록과 주변블록의 위치관계를 예시한 도면이다.
도 6은 본 발명의 일 실시예에 따른 영상 복호화 장치의 구성을 간략하게 나타낸 블록 구성도이다.
도 7은 본 발명의 제1 실시예에 따른 영상 부호화 방법을 도시한 흐름도이다.
도 8은 본 발명의 제2 실시예에 따른 영상 부호화 방법을 도시한 흐름도이다.
도 9는 본 발명의 제3 실시예에 따른 영상 부호화 방법을 도시한 흐름도이다.
도 10은 본 발명의 일 실시예에 따른 영상 복호화 방법을 도시한 흐름도이다.
이하, 본 발명의 일부 실시예들을 예시적인 도면을 통해 상세하게 설명한다. 각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.
또한, 본 발명의 구성 요소를 설명하는 데 있어서, 제 1, 제 2, A, B, (a), (b) 등의 용어를 사용할 수 있다. 이러한 용어는 그 구성 요소를 다른 구성 요소와 구별하기 위한 것일 뿐, 그 용어에 의해 해당 구성 요소의 본질이나 차례 또는 순서 등이 한정되지 않는다. 어떤 구성 요소가 다른 구성요소에 "연결", "결합" 또는 "접속"된다고 기재된 경우, 그 구성 요소는 그 다른 구성요소에 직접적으로 연결되거나 또는 접속될 수 있지만, 각 구성 요소 사이에 또 다른 구성 요소가 "연결", "결합" 또는 "접속"될 수도 있다고 이해되어야 할 것이다.
이하에서 후술할 영상 부호화 장치(Video Encoding Apparatus), 영상 복호화 장치(Video Decoding Apparatus)는 개인용 컴퓨터(PC: Personal Computer), 노트북 컴퓨터, 개인 휴대 단말기(PDA: Personal Digital Assistant), 휴대형 멀티미디어 플레이어(PMP: Portable Multimedia Player), 플레이스테이션 포터블(PSP: PlayStation Portable), 무선 통신 단말기(Wireless Communication Terminal), 스마트폰(Smart Phone) 등과 같은 사용자 단말기이거나 응용 서버와 서비스 서버 등 서버 단말기일 수 있으며, 각종 기기 또는 유무선 통신망과 통신을 수행하기 위한 통신 모뎀 등의 통신 장치, 영상을 부호화하거나 복호화하거나 부호화 또는 복호화를 위해 인터/인트라 예측하기 위한 각종 프로그램과 데이터를 저장하기 위한 메모리, 프로그램을 실행하여 연산 및 제어하기 위한 마이크로프로세서 등을 구비하는 다양한 장치를 의미할 수 있다.
또한, 영상 부호화 장치에 의해 비트스트림으로 부호화된 영상은 실시간 또는 비실시간으로 인터넷, 근거리 무선 통신망, 무선랜망, 와이브로망, 이동통신망 등의 유무선 통신망 등을 통하거나 케이블, 범용 직렬 버스(USB: Universal Serial Bus) 등과 같은 다양한 통신 인터페이스를 통해 영상 복호화 장치로 전송되어 영상 복호화 장치에서 복호화되어 영상으로 복원되고 재생될 수 있다.
통상적으로 동영상은 일련의 픽처(Picture)로 구성되어 있으며, 각 픽처들은 프레임 또는 블록(Block)과 같은 소정의 영역으로 분할될 수 있다. 영상의 영역이 블록으로 분할되는 경우에는 분할된 블록은 부호화 방법에 따라 크게 인트라 블록(Intra Block), 인터 블록(Inter Block)으로 분류될 수 있다. 인트라 블록은 인트라 예측 부호화(Intra Prediction Coding) 방식을 사용하여 부호화되는 블록을 뜻하는데, 인트라 예측 부호화란 현재 부호화를 수행하는 현재 픽처 내에서 이전에 부호화되고 복호화되어 복원된 블록들의 화소를 이용하여 현재 블록의 화소를 예측함으로써 예측 블록을 생성하고 현재 블록의 화소와의 차분값을 부호화하는 방식이다. 인터 블록은 인터 예측 부호화(Inter Prediction Coding)를 사용하여 부호화되는 블록을 뜻하는데, 인터 예측 부호화란 하나 이상의 과거 픽처 또는 미래 픽처를 참조하여 현재 픽처 내의 현재 블록을 예측함으로써 예측 블록을 생성하고 현재 블록과의 차분값을 부호화하는 방식이다. 여기서, 현재 픽처를 부호화하거나 복호화하는데 참조되는 프레임을 참조 프레임(Reference Frame)이라고 하고, 참조프레임을 포함하고 있는 픽처를 참조픽처라 한다.
도 1은 본 발명의 일 실시예에 따른 영상 부호화 장치를 간략하게 나타낸 블록 구성도이다.
본 발명의 일 실시예에 따른 영상 부호화 장치(100)는 모드결정기(110), 예측기(Predictor, 120), 감산기(Subtracter, 130), 변환기(Transformer, 140), 스캐너(Scanner, 150), 부호화기(Encoder, 160), 역변환기(Inverse Transformer, 170), 가산기(Adder, 180) 및 필터(Filter, 190)를 포함하여 구성될 수 있다.
부호화하고자 하는 입력 영상은 블록 단위로 입력될 수 있는데, 블록은 매크로블록(Macroblock)이 될 수 있다. 본 발명의 일 실시예에서, 매크로블록의 형태는 M×N의 다양한 형태일 수 있으며, 여기서, M과 N은 2n(단, n은 1 이상의 정수임)의 값을 가지는 자연수일 수 있다. 또한, 부호화할 프레임마다 다른 형태의 블록을 이용할 수 있으며, 매크로블록의 형태가 다양한 형태가 가능한 경우에 이에 대한 정보인 블록 타입에 대한 정보를 각 프레임마다 부호화하여, 영상 복호화 장치에서 부호화된 데이터를 복호화할 때 복호화할 프레임의 블록의 형태를 결정하도록 할 수 있다.
이를 위해, 영상 부호화 장치(100)는 블록 타입을 결정하고 블록 타입에 대한 정보를 부호화하여 부호화 데이터에 포함시키는 블록 타입 결정기(미도시)를 추가로 포함하여 구성될 수 있다.
모드결정기(110)는 예측모드의 집합 중에서 하나를 선택하여 예측모드를 설정할 수 있다. 영상 부호화 장치(100)에서 사용되는 예측모드의 집합에는 순방향 시간적 확장스킵 모드, 역방향 시간적 확장스킵 모드, 역방향 공간적 확장스킵 모드 중에서 하나 이상이 포함될 수 있다.
부호화기(160)는 모드결정기(110)에서 결정된 예측모드를 부호화한다. 부호화된 예측모드에 대한 데이터는 영상 복호기로 전송될 수 있다.
도 2는 현재 블록 및 현재블록의 전방참조 프레임(L0) 및 후방 참조프레임(L1)의 위치관계를 도시한 도면이다.
영상 부호화 장치(100)에서 사용되는 예측모드의 집합에 순방향 시간적 확장스킵 모드가 포함되는 경우에, 모드결정기(110)는 현재 블록과 동일한 위치의 후방 참조픽처(또는 후방 참조 프레임) 내의 블록(앵커블록이라 칭함)을 참조하고, 앵커블록의 전방 참조블록에 대한 움직임 벡터(MV)와 동일한 방향의 전방 참조블록에 대한 움직임 벡터를 예측 움직임 벡터로 설정하고, 설정된 예측 움직임 벡터를 이용하여 움직임 보상을 수행하고 움직임 보상의 결과가 최적 스킵조건을 만족하면 예측모드를 순방향 시간적 확장스킵 모드로 설정한다.
여기서, 최적스킵 조건이란, 모든 인터예측 가능 모드 집합 내의 인터 예측 모드 후보 각각에 대해 현재 블록을 예측하고 부호화하는 경우에 발생하는 비트량과 왜곡치를 고려하여 순방향 시간적 확장스킵 모드의 율-왜곡 비용이 작은 경우이며, 이 경우에 예측모드를 순방향 시간적 확장스킵 모드로 설정한다.
도 2에 도시한 바와 같이, 모드결정기(110)는 현재 블록의 현재 프레임 내에서의 위치와 동일한 위치를 갖는 후방 참조 프레임(L1 또는 List 1) 내의 블록인 동일 위치블록의 전방 참조블록 움직임 벡터(MV)와 동일한 방향을 갖는 전방 움직임 벡터(MVL0)(즉, 전방 참조블록에 대한 움직임 벡터)를 예측 움직임 벡터로 설정한다. 여기서 설정된 예측 움직임 벡터를 이용하여 움직임 보상을 수행하고 움직임 보상의 결과가 최적 스킵조건을 만족하면 현재 블록의 예측모드를 순방향 시간적 확장스킵 모드로 설정한다.
만일, 영상 부호화 장치(100)에서 사용되는 예측모드의 집합에 역방향 시간적 확장스킵 모드가 포함되는 경우에는 모드결정기(110)는 현재 블록과 동일한 위치의 후방 참조프레임 내의 블록(앵커블록이라 칭함)을 참조하고, 앵커블록의 전방 참조블록에 대한 움직임 벡터(MV)와 정반대 방향의 후방 움직임 벡터(MVL1)(즉, 후방 참조블록에 대한 움직임 벡터)를 예측 움직임 벡터로 설정한다. 여기서 설정된 예측 움직임 벡터를 이용하여 움직임 보상을 수행하고 움직임 보상의 결과가 최적 스킵조건을 만족하면 예측모드를 역방향 시간적 확장스킵 모드로 설정한다.
만일, 역방향 시간적 확장스킵 모드를 포함한 모든 인터예측 가능 모드 집합 내의 인터 예측 모드 후보 각각에 대해 현재 블록을 예측하고 부호화하는 경우에 발생하는 비트량과 왜곡치를 고려하여 역방향 시간적 확장스킵 모드의 율-왜곡 비용이 작은 경우 최적 스킵조건을 만족하는 것으로 판단할 수 있으며, 이 경우에 예측모드를 역방향 시간적 확장스킵 모드로 설정한다.
현재 블록의 전방 움직임 벡터(MVL0) 및 후방 움직임 벡터(MVL1)는 수학식 1로부터 구할 수 있다.
수학식 1
Figure PCTKR2011004521-appb-M000001
여기서 TRB는 참조픽처(L0)와 현재 부호화대상 픽처(현재픽처) 간의 시간 간격이고, TRD는 참조픽처(L0)와 후방 참조 픽처와의 시간 간격을 의미한다.
한편, 후방 참조프레임 내의 블록이란 모든 후방 참조프레임 중에서 현재 픽처와 가장 가까운 참조프레임 내의 블록일 수 있다.
도 3은 순방향 시간적 확장스킵 모드에서 예측 움직임 벡터를 도시한 도면이고, 도 4는 역방향 시간적 확장스킵 모드에서 예측 움직임 벡터를 도시한 도면이다.
도 5는 현재 블록과 주변블록의 위치관계를 예시한 도면이다.
영상 부호화 장치(100)에서 사용되는 예측모드의 집합에 역방향 공간적 확장스킵 모드가 포함되는 경우에, 모드결정기(110)는 현재 블록(E)의 주변블록(예를 들어, A(좌측블록), B(상측블록), C(우상측블록))의 후방 움직임 벡터로부터 현재 블록(E)의 예측 움직임 벡터로 결정하고, 결정된 예측 움직임 벡터를 이용하여 움직임 보상을 수행하고 움직임 보상의 결과가 최적 스킵조건을 만족하면 예측모드를 역방향 공간적 확장스킵 모드로 설정한다. 여기서 현재블록(E)의 주변블록은 A, B, C에만 한정되지 않으며, A, B, C, D(좌상측블록)일 수도 있다.
만일, 역방향 공간적 확장스킵 모드를 포함한 모든 인터예측 가능 모드 집합 내의 인터 예측 모드 후보 각각에 대해 현재 블록을 예측하고 부호화하는 경우에 발생하는 비트량과 왜곡치를 고려하여 역방향 공간적 확장스킵 모드의 율-왜곡 비용이 작은 경우 최적 스킵조건을 만족하는 것으로 판단할 수 있으며, 이 경우에 예측모드를 역방향 공간적 확장스킵 모드로 설정한다.
한편, 예측 움직임 벡터는 현재 블록의 주변블록(A, B, C)의 후방 움직임 벡터들의 중앙값으로 설정될 수 있으나, 본 발명이 이에 한정되지는 않으며, 다양한 방법으로 주변블록을 결정할 수 있으며, 또한 주변블록의 후방 움직임 벡터로부터 예측 움직임 벡터를 다양한 방법으로 산출할 수 있다. 또한, 예측 움직임 벡터의 수평 성분은 주변블록(A, B, C)의 후방 움직임 벡터의 수평성분으로부터 계산될 수 있으며, 예측 움직임 벡터의 수직 성분은 주변블록(A, B, C)의 후방 움직임 벡터의 수직성분으로부터 계산될 수 있다.
예측기(120)는 현재 블록을 예측하여 예측 블록을 생성한다. 즉, 예측기(120)는 영상에서 부호화하고자 하는 현재 블록의 각 화소의 화소값(Pixel Value)을 예측하여 예측된 각 화소의 예측 화소값(Predicted Pixel Value)을 갖는 예측 블록(Predicted Block)을 생성한다. 여기서, 예측기(120)는 인트라 예측 또는 인터 예측을 이용하여 현재 블록을 예측할 수 있다. 하지만 예측모드가 순방향 시간적 확장스킵 모드, 역방향 시간적 확장스킵 모드, 역방향 공간적 확장스킵 모드 중에서 하나인 경우에는 예측기(120)는 예측 블록을 생성하지 않는다.
감산기(130)는 현재 블록에서 예측 블록을 감산하여 잔여 블록(Residual Block)을 생성한다. 즉, 감산기(130)는 부호화하고자 하는 현재 블록의 각 화소의 화소값과 예측기(120)에서 예측한 예측 블록의 각 화소의 예측 화소값의 차이를 계산하여 블록 형태의 잔여 신호(Residual Signal)를 갖는 잔여 블록을 생성한다.
변환기(140)가 잔여 블록을 변환할 때, 양자화 과정에 변환 과정이 포함되어 있을 수 있으며 이 경우 양자화가 완료되어야 변환도 완료된다. 여기서, 변환 방식으로는 하다마드 변환(Hadamard Transform), 이산 코사인 트랜스폼 기반의 정수 변환(Discrete Cosine Transform Based Integer Transform, 이하 '정수 변환'이라고 약칭함) 등과 같은 공간 영역의 영상 신호를 주파수 영역으로 변환하는 기법이 이용될 수 있으며, 양자화 방식으로는 데드존 균일 경계 양자화(DZUTQ: Dead Zone Uniform Threshold Quantization, 이하 'DZUTQ'라 칭함) 또는 양자화 가중치 매트릭스(Quantization Weighted Matrix) 등과 같은 다양한 양자화 기법이 이용될 수 있다.
스캐너(150)는 변환기(140)에 의해 생성된 색공간 예측 블록의 계수들을 스캐닝(Scanning)하여 계수열을 생성한다. 이때, 스캐닝 방식은 변환 기법, 양자화 기법, 블록(매크로블록 또는 서브블록)의 특성을 고려하며, 스캐닝 순서는 스캐닝한 계수열이 최소의 길이가 되도록 결정될 수 있다. 도 1에서는 스캐너(150)가 부호화기(160)와 독립적으로 구현되는 것으로 도시하고 설명하지만, 스캐너(150)는 생략되어 그 기능이 부호화기(160)에 통합될 수도 있다.
이러한 부호화 기술로서는 엔트로피 부호화(Entropy Encoding) 기술이 이용될 수 있으나, 반드시 이에 한정하지 않고 다른 다양한 부호화 기술이 사용될 수도 있을 것이다. 또한, 부호화기(160)는 예측모드뿐만 아니라 부호화된 비트열을 복호화하는 데 필요한 다양한 정보들을 부호화 데이터에 포함시킬 수 있다. 여기서, 부호화된 비트열을 복호화하는 데 필요한 다양한 정보들이란 블록 타입에 대한 정보 등 다양한 정보들이 될 수도 있다.
역변환기(170)는 변환기(140)에 의해 발생된 변환된 잔여 블록을 역 변환(Inverse Transform)하여 잔여 블록을 복원(Reconstruction)한다. 만일 변환기(140)에서 양자화도 같이 수행되었다면 역변환기(170)에서는 역 양자화 후 역 변환을 수행하며 변환기(140)가 수행한 변환 과정과 양자화 과정을 역으로 수행함으로써 이루어질 수 있다.
가산기(180)는 예측기(120)에 의해 예측된 예측 블록과 역변환기(170)에 의해 생성된 잔여 블록을 가산하여 현재 블록을 복원한다.
필터(190)는 가산기(180)에 의해 복원되는 현재 블록을 필터링(Filtering)한다. 이때, 필터(190)는 영상의 블록 단위의 변환 및 양자화에 의해 블록 경계 또는 변환 경계에서 발생하는 블록화 현상(Blocking Effects)을 감소시킨다.
하지만, 예측모드가 순방향 시간적 확장스킵 모드, 역방향 시간적 확장스킵 모드, 역방향 공간적 확장스킵 모드 중에서 하나인 경우에는 감산기(130), 변환기(140), 스캐너(150), 역변환기(170), 가산기(180), 필터(190)는 작동하지 않을 수 있다.
도 6은 본 발명의 일 실시예에 따른 영상 복호화 장치의 구성을 간략하게 나타낸 블록 구성도이다.
본 발명의 일 실시예에 따른 영상 복호화 장치(600)는 복호화기(610), 역 스캐너(620), 역변환기(630), 가산기(640), 예측기(650) 및 필터(660)를 포함하여 구성될 수 있다. 여기서, 역 스캐너(620)와 필터(660)는 반드시 포함되어야 하는 것은 아니며 구현 방식에 따라 선택적으로 생략될 수 있으며, 역 스캐너(620)가 생략되는 경우에는 그 기능이 복호화기(610)에 통합되어 구현될 수 있다.
복호화기(610)는 부호화 데이터를 복호화하여 예측모드를 복호한다. 영상 부호화 장치(100)에서 스캐너(150)의 기능이 부호화기(160)에 통합되어 구현된 경우 영상 복호화 장치(600)에서도 역 스캐너(620)는 생략되어 그 기능이 복호화기(610)에 통합되어 구현되므로, 복호화기(610)는 부호화 데이터를 역 스캐닝하여 변환된 잔여 블록을 복원할 수 있다.
또한, 복호화기(610)는 부호화 데이터를 복호화하여 색공간 예측 블록뿐만 아니라 복호화에 필요한 정보들을 복호화하거나 추출할 수 있다. 복호화에 필요한 정보들은 부호화 데이터 내의 부호화된 비트열을 복호화하는 데 필요한 정보들을 말하며, 예를 들어 블록 타입에 대한 정보, 예측 모드가 인트라 예측 모드인 경우에는 인트라 예측 모드에 대한 정보, 예측 모드가 인터 예측 모드인 경우에는 움직임 벡터에 대한 정보, 변환 및 양자화 타입에 대한 정보 등이 될 수 있지만, 이외의 다양한 정보들이 될 수도 있다.
블록 타입에 대한 정보가 전달되어 입력되는 경우에는 역변환기(630)와 예측기(650)로 전달될 수 있으며, 변환 타입(또는 변환 및 양자화 타입)에 대한 정보는 역변환기(630)로 전달될 수 있으며, 예측 모드에 대한 정보와 움직임 벡터에 대한 정보와 같은 예측에 필요한 정보들은 예측기(650)로 전달될 수 있다.
역 스캐너(620)는 복호화기(610)에서 복호되는 변환 계수열을 복원하여 전달하면 변환 계수열을 역 스캐닝하여 예측 블록을 복원한다.
역 스캐너(620)는 추출된 계수열을 역 지그재그 스캔 등 다양한 역 스캐닝 방식으로 역 스캐닝하여 색공간 예측 블록을 생성한다. 이때의 역 스캐닝 방식은 복호화부(610)에서 변환의 크기에 대한 정보를 얻어 이에 해당하는 역 스캐닝 방법을 사용하여 잔여 블록을 생성할 수 있다.
역변환기(630)는 복원되는 변환된 잔여 블록을 역 변환하여 잔여 블록을 복원한다. 이때, 역변환기(630)는 변환 타입에 따라 변환된 잔여 블록을 역 변환할 수 있다. 여기서, 역변환기(630)가 변환된 잔여 블록을 변환 타입에 따라 역 변환하는 방법은 영상 부호화 장치(100)의 변환기(140)에서 변환 타입에 따라 변환하는 과정을 역으로 수행하는 것과 동일 또는 유사하므로, 역 변환하는 방법에 대해서는 상세한 설명을 생략한다.
예측기(650)는 현재 블록을 예측하여 예측 블록을 생성한다.
예측기(650)는 블록 타입에 대한 정보에 의해 식별되는 블록 타입에 따라 현재 블록의 크기와 형태를 결정하고, 예측에 필요한 정보에 의해 식별되는 인트라 예측 모드 또는 움직임 벡터를 이용하여 현재 블록을 예측하여 예측 블록을 생성할 수 있다. 이때, 예측기(650)는 영상 부호화 장치(100)의 예측기(120)와 동일 또는 유사한 방법으로, 현재 블록을 서브블록으로 분할하고 분할된 서브블록별로 예측하여 생성되는 예측 서브블록을 결합하여 예측 블록을 생성할 수 있다.
가산기(640)는 역변환기(630)에 의해 복원되는 잔여 블록과 예측기(650)에 의해 생성되는 예측 블록을 가산하여 현재 블록을 복원한다.
필터(660)는 가산기(640)에 의해 복원되는 현재 블록을 필터링하고, 복원되어 필터링된 현재 블록은 픽처 단위로 누적되어 참조 픽처로서 메모리(미도시) 등에 저장되어 예측기(650)에서 다음 블록 또는 다음 픽처를 예측할 때 활용될 수 있다.
필터(660)가 필터링을 수행하는 방법은 영상 부호화 장치(100)의 필터(190)가 디블로킹 필터링하는 과정과 동일 또는 유사하므로, 필터링하는 방법에 대해서는 상세한 설명을 생략한다.
하지만, 예측모드가 순방향 시간적 확장스킵 모드, 역방향 시간적 확장스킵 모드, 역방향 공간적 확장스킵 모드 중에서 하나인 경우에는 역스캐너(620), 역변환기(630), 가산기(640), 필터(660)는 작동하지 않을 수 있다.
예측기(650)는 복호된 예측모드가 순방향 시간적 확장스킵 모드이면, 현재 블록과 동일한 위치의 후방 참조프레임 내의 블록의 전방 참조블록 움직임 벡터와 동일한 방향의 전방 움직임 벡터를 이용하여 현재 블록을 예측하여 예측 블록을 생성한다. 즉, 수학식 1과 같이 현재 블록의 전방 움직임 벡터(MVL0)를 구하고 전방 움직임 벡터(MVL0)가 가리키는 블록(도 3 참조)을 예측 블록으로 생성한다. 한편, 잔여블록의 화소에 대한 정보가 영상 부호화기(100)로부터 전송되지 않으므로 여기서 생성된 예측 블록이 복원 블록이 된다.
예측기(650)는 복호된 예측모드가 역방향 시간적 확장스킵 모드이면, 현재 블록과 동일한 위치의 후방 참조프레임 내의 블록의 전방 참조블록 움직임 벡터와 정반대 방향의 후방 움직임 벡터를 이용하여 현재 블록을 예측하여 예측 블록을 생성한다. 즉, 수학식 1과 같이 현재 블록의 후방 움직임 벡터(MVL1)를 구하고 후방 움직임 벡터(MVL1)가 가리키는 블록(도 4 참조)을 예측 블록으로 생성한다. 한편, 잔여블록의 화소에 대한 정보가 영상 부호화기(100)로부터 전송되지 않으므로 여기서 생성된 예측 블록이 복원 블록이 된다.
이때, 후방 참조프레임 내의 블록은, 모든 후방 참조프레임 중에서 현재 블록과 가장 가까운 참조프레임 내의 블록일 수 있다.
예측기(650)는 복호된 예측모드가 역방향 공간적 확장스킵 모드이면, 현재 블록의 주변블록의 후방 움직임 벡터를 이용하여 현재 블록을 예측하여 예측 블록을 생성한다. 즉, 도 5와 같은 현재 블록의 주변 블록(A, B, C)의 후방 움직임 벡터들의 중앙값으로 예측 움직임 벡터로 설정될 수 있으나, 본 발명이 이에 한정되지는 않으며, 다양한 방법으로 주변블록을 결정할 수 있으며, 또한 주변블록의 후방 움직임 벡터로부터 예측 움직임 벡터를 다양한 방법으로 산출할 수 있다. 또한, 예측 움직임 벡터의 수평 성분은 주변블록(A, B, C)의 후방 움직임 벡터의 수평성분으로부터 계산될 수 있으며, 예측 움직임 벡터의 수직 성분은 주변블록(A, B, C)의 후방 움직임 벡터의 수직성분으로부터 계산될 수 있다. 한편, 잔여블록의 화소에 대한 정보가 영상 부호화기(100)로부터 전송되지 않으므로 여기서 생성된 예측 블록이 복원 블록이 된다.
이때, 후방 움직임 벡터는 현재 블록의 주변블록의 후방 움직임 벡터들의 중앙값으로 설정될 수 있다.
한편, 본 발명의 일 실시예에 따른 영상 부호화/복호화 장치는 도 1의 영상 부호화 장치(100)와 도 6의 영상 복호화 장치(600)를 결합함으로써 구현할 수 있다.
본 발명의 일 실시예에 따른 영상 부호화/복호화 장치는 현재 블록의 주변블록의 후방 움직임 벡터를 현재 블록의 예측 움직임 벡터로 설정하거나 현재 블록과 동일한 위치의 후방 참조프레임 내의 블록의 전방 참조블록 움직임 벡터로부터 예측 움직임 벡터를 설정하고, 예측 움직임 벡터를 이용하여 움직임 보상을 수행하고 움직임 보상의 결과가 최적 스킵조건을 만족하면 예측모드를 설정하고 예측모드를 부호화하는 영상 부호화기(영상 부호화 장치(100)를 이용하여 구현할 수 있음) 및, 부호화 데이터를 복호화하여 예측모드를 복호하고, 예측모드가 순방향 시간적 확장스킵 모드이면 현재 블록과 동일한 위치의 후방 참조프레임 내의 블록의 전방 참조블록 움직임 벡터와 동일한 방향의 전방 움직임 벡터를 이용하여 현재 블록을 예측하고, 예측모드가 역방향 시간적 확장스킵 모드이면 현재 블록과 동일한 위치의 후방 참조프레임 내의 블록의 전방 참조블록 움직임 벡터와 정반대 방향의 후방 움직임 벡터를 이용하여 현재 블록을 예측하여 예측 블록을 생성하고, 예측모드가 역방향 공간적 확장스킵 모드이면 현재 블록의 주변블록의 후방 움직임 벡터를 이용하여 현재 블록을 예측하여 예측 블록을 생성하는 영상 복호화기(영상 복호화 장치(600)를 이용하여 구현할 수 있음)을 포함한다.
도 7은 본 발명의 제1 실시예에 따른 영상 부호화 방법을 도시한 흐름도이다.
본 발명의 제1 실시예에 따른 영상 부호화 방법은, 현재 블록과 동일한 위치의 후방 참조프레임 내의 블록(앵커블록)을 참조하여, 앵커블록의 전방 참조블록에 대한 움직임 벡터와 동일한 방향의 전방 움직임 벡터를 예측 움직임 벡터로 설정하는 단계(S702), 예측 움직임 벡터를 이용하여 움직임 보상을 수행하는 단계(S704), 움직임 보상의 결과가 최적 스킵조건을 만족하면 예측모드를 순방향 시간적 확장스킵 모드로 설정하는 단계(S706), 예측모드를 부호화하는 단계(S808)를 포함할 수 있다.
여기서, 후방 참조프레임 내의 블록은 모든 후방 참조프레임 중에서 현재 블록과 가장 가까운 참조프레임 내의 블록일 수 있다.
여기서, 순방향 시간적 확장스킵 모드를 포함한 모든 인터예측 가능 모드 집합 내의 인터 예측 모드 후보 각각에 대해 현재 블록을 예측하고 부호화하는 경우에 발생하는 비트량과 왜곡치를 고려하여 순방향 시간적 확장스킵 모드의 율-왜곡 비용이 작은 경우 최적 스킵조건을 만족하는 것으로 판단할 수 있다.
본 발명의 제1 실시예에 따른 영상 부호화 방법의 동작은 본 발명의 일 실시예에 따른 영상 부호화 장치의 설명시 설명되었으므로 여기서 상세한 설명은 생략한다.
도 8은 본 발명의 제2 실시예에 따른 영상 부호화 방법을 도시한 흐름도이다.
본 발명의 제2 실시예에 따른 영상 부호화 방법은 현재 블록과 동일한 위치의 후방 참조프레임 내의 블록(앵커블록)을 참조하여, 앵커블록의 전방 참조블록에 대한 움직임 벡터와 정반대 방향의 후방 움직임 벡터를 예측 움직임 벡터로 설정하는 단계(S802), 예측 움직임 벡터를 이용하여 움직임 보상을 수행하는 단계(S804), 움직임 보상의 결과가 최적 스킵조건을 만족하면 예측모드를 역방향 시간적 확장스킵 모드로 설정하는 단계(S806), 예측모드를 부호화하는 단계(S808)를 포함할 수 있다.
여기서, 후방 참조프레임 내의 블록은 모든 후방 참조프레임 중에서 현재 블록과 가장 가까운 참조프레임 내의 블록일 수 있다.
여기서, 역방향 시간적 확장스킵 모드를 포함한 모든 인터예측 가능 모드 집합 내의 인터 예측 모드 후보 각각에 대해 현재 블록을 예측하고 부호화하는 경우에 발생하는 비트량과 왜곡치를 고려하여 역방향 시간적 확장스킵 모드의 율-왜곡 비용이 작은 경우 최적 스킵조건을 만족하는 것으로 판단할 수 있다.
본 발명의 제2 실시예에 따른 영상 부호화 방법의 동작은 본 발명의 일 실시예에 따른 영상 부호화 장치의 설명시 설명되었으므로 여기서 상세한 설명은 생략한다.
도 9는 본 발명의 제3 실시예에 따른 영상 부호화 방법을 도시한 흐름도이다.
본 발명의 제3 실시예에 따른 영상 부호화 방법은 현재 블록의 주변블록의 후방 움직임 벡터를 상기 현재 블록의 예측 움직임 벡터로 설정하는 단계(S902), 예측 움직임 벡터를 이용하여 움직임 보상을 수행하는 단계(S904), 움직임 보상의 결과가 최적 스킵조건을 만족하면 예측모드를 역방향 공간적 확장스킵 모드로 설정하는 단계(S906), 예측모드를 부호화하는 단계(S908)를 포함할 수 있다.
여기서, 역방향 공간적 확장스킵 모드를 포함한 모든 인터예측 가능 모드 집합 내의 인터 예측 모드 후보 각각에 대해 현재 블록을 예측하고 부호화하는 경우에 발생하는 비트량과 왜곡치를 고려하여 역방향 공간적 확장스킵 모드의 율-왜곡 비용이 작은 경우 최적 스킵조건을 만족하는 것으로 판단할 수 있다.
여기서, 후방 움직임 벡터는, 현재 블록의 주변블록의 후방 움직임 벡터들의 중앙값으로 설정될 수 있다.
본 발명의 제3 실시예에 따른 영상 부호화 방법의 동작은 본 발명의 일 실시예에 따른 영상 부호화 장치의 설명시 설명되었으므로 여기서 상세한 설명은 생략한다.
도 10은 본 발명의 일 실시예에 따른 영상 복호화 방법을 도시한 흐름도이다.
본 발명의 일 실시예에 따른 영상 복호화 방법은 부호화 데이터를 복호화하여 예측모드를 복호하는 단계(S1002), 예측모드를 판정하는 단계(S1004), 예측모드가 순방향 시간적 확장스킵 모드이면 현재 블록과 동일한 위치의 후방 참조프레임 내의 블록의 전방 참조블록 움직임 벡터와 동일한 방향의 전방 움직임 벡터를 이용하여 현재 블록을 예측하여 예측 블록을 생성하는 단계(S1006), 예측모드가 역방향 시간적 확장스킵 모드이면, 현재 블록과 동일한 위치의 후방 참조프레임 내의 블록의 전방 참조블록 움직임 벡터와 정반대 방향의 후방 움직임 벡터를 이용하여 현재 블록을 예측하여 예측 블록을 생성하는 단계(S1008), 예측모드가 역방향 공간적 확장스킵 모드이면, 현재 블록의 주변블록의 후방 움직임 벡터를 이용하여 현재 블록을 예측하여 예측 블록을 생성하는 단계(S1010), 현재 블록을 예측하여 예측 블록을 생성하는 단계(S1012)를 포함할 수 있다.
여기서, 후방 참조프레임 내의 블록은, 모든 후방 참조프레임 중에서 상기 현재 블록과 가장 가까운 참조프레임 내의 블록일 수 있다.
여기서, 후방 움직임 벡터는, 현재 블록의 주변블록의 후방 움직임 벡터들의 중앙값으로 설정될 수 있다.
한편, S1006, S1008, S1010 단계를 하나의 실시예에 포함될 수도 있지만, 실시예에 따라서는 본 발명의 일 실시예에 따른 영상 복호화 방법에서 설정될 수 있는 예측 모드가 순방향 시간적 확장스킵 모드가 포함되지 않는 경우에는 S1006 단계가 생략될 수 있으며, 역방향 시간적 확장스킵 모드가 포함되지 않는 경우에는 S1008 단계가 생략될 수 있으며, 역방향 공간적 확장스킵 모드가 포함되지 않는 경우에는 S1010 단계가 생략될 수 있다.
본 발명의 일 실시예에 따른 영상 복호화 방법의 동작은 본 발명의 일 실시예에 따른 영상 복호화 장치의 설명시 설명되었으므로 여기서 상세한 설명은 생략한다.
본 발명의 일 실시예에 따른 영상 부호화/복호화 방법은, 도 7 내지 도 9의 본 발명의 제1 실시예 내지 제3 실시예에 따른 영상 부호화 방법과 도 10의 본 발명의 일 실시예에 따른 영상 복호화 방법을 결합하여 구현함으로써 실현할 수 있다.
본 발명의 일 실시예에 따른 영상 부호화/복호화 방법은, 현재 블록의 주변블록의 후방 움직임 벡터를 상기 현재 블록의 예측 움직임 벡터로 설정하거나 현재 블록과 동일한 위치의 후방 참조프레임 내의 블록의 전방 참조블록 움직임 벡터로부터 예측 움직임 벡터를 설정하고, 예측 움직임 벡터를 이용하여 움직임 보상을 수행하고 움직임 보상의 결과가 최적 스킵조건을 만족하면 예측모드를 설정하고 예측모드를 부호화하는 단계, 및 부호화 데이터를 복호화하여 예측모드를 복호하고, 예측모드가 순방향 시간적 확장스킵 모드이면 현재 블록과 동일한 위치의 후방 참조프레임 내의 블록의 전방 참조블록 움직임 벡터와 동일한 방향의 전방 움직임 벡터를 이용하여 현재 블록을 예측하고, 예측모드가 역방향 시간적 확장스킵 모드이면 현재 블록과 동일한 위치의 후방 참조프레임 내의 블록의 전방 참조블록 움직임 벡터와 정반대 방향의 후방 움직임 벡터를 이용하여 현재 블록을 예측하여 예측 블록을 생성하고, 예측모드가 역방향 공간적 확장스킵 모드이면 현재 블록의 주변블록의 후방 움직임 벡터를 이용하여 현재 블록을 예측하여 예측 블록을 생성하는 단계를 포함하여 이루어질 수 있다.
이상에서 설명한 바와 같이 본 발명의 일 실시예에 의하면, 현재 블록의 움직임 벡터를 효율적으로 부호화하기 위해 주변 블록의 움직임 벡터 상관도를 기반으로 움직임 벡터의 문맥을 생성하여 후보 움직임 벡터를 주변 블록의 상황에 맞도록 적응적으로 제공함으로써, 현재 블록의 움직임 벡터의 부호화 성능을 크게 향상시킴으로써 비디오 압축 장치의 부호화 성능 혹은 복원 영상의 화질을 향상시키는 효과가 있다.
이상에서, 본 발명의 실시예를 구성하는 모든 구성 요소들이 하나로 결합하거나 결합하여 동작하는 것으로 설명되었다고 해서, 본 발명이 반드시 이러한 실시예에 한정되는 것은 아니다. 즉, 본 발명의 목적 범위 안에서라면, 그 모든 구성 요소들이 하나 이상으로 선택적으로 결합하여 동작할 수도 있다. 또한, 그 모든 구성 요소들이 각각 하나의 독립적인 하드웨어로 구현될 수 있지만, 각 구성 요소들의 그 일부 또는 전부가 선택적으로 조합되어 하나 또는 복수 개의 하드웨어에서 조합된 일부 또는 전부의 기능을 수행하는 프로그램 모듈을 갖는 컴퓨터 프로그램으로서 구현될 수도 있다. 그 컴퓨터 프로그램을 구성하는 코드들 및 코드 세그먼트들은 본 발명의 기술 분야의 당업자에 의해 용이하게 추론될 수 있을 것이다. 이러한 컴퓨터 프로그램은 컴퓨터가 읽을 수 있는 저장매체(Computer Readable Media)에 저장되어 컴퓨터에 의하여 읽혀지고 실행됨으로써, 본 발명의 실시예를 구현할 수 있다. 컴퓨터 프로그램의 저장매체로서는 자기 기록매체, 광 기록매체, 캐리어 웨이브 매체 등이 포함될 수 있다.
또한, 이상에서 기재된 "포함하다", "구성하다" 또는 "가지다" 등의 용어는, 특별히 반대되는 기재가 없는 한, 해당 구성 요소가 내재할 수 있음을 의미하는 것이므로, 다른 구성 요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것으로 해석되어야 한다. 기술적이거나 과학적인 용어를 포함한 모든 용어들은, 다르게 정의되지 않는 한, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미가 있다. 사전에 정의된 용어와 같이 일반적으로 사용되는 용어들은 관련 기술의 문맥상의 의미와 일치하는 것으로 해석되어야 하며, 본 발명에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
이상에서 설명한 바와 같이 본 발명의 실시예에 의하면, 본 발명은 기 복호된 참조 영상의 데이터를 활용하여 단방향에서의 스킵모드를 적용 가능하도록 함으로써 현재 블록과 참조 영상 데이터 간의 중복성을 효율적으로 제거하여 압축 효율을 개선하기 위한 것으로, 비디오 데이터 압축의 성능을 더욱 향상시켜 같은 비트율에서 보다 우수한 복원 화질을 얻는 효과를 얻는데 적합하여 산업상 이용가능성이 크다.
CROSS-REFERENCE TO RELATED APPLICATION
본 특허출원은 2010년 7월 22일 한국에 출원한 특허출원번호 제10-2010-0070755호에 대해 미국 특허법 119(a)조(35 U.S.C §119(a))에 따라 우선권을 주장하며, 그 모든 내용은 참고문헌으로 본 특허출원에 병합된다. 아울러, 본 특허출원은 미국 이외에 국가에 대해서도 위와 동일한 이유로 우선권을 주장하면 그 모든 내용은 참고문헌으로 본 특허출원에 병합된다.

Claims (32)

  1. 영상을 부호화/복호화하는 장치에 있어서,
    현재 블록의 주변블록의 후방 참조블록에 대한 움직임 벡터를 상기 현재 블록의 예측 움직임 벡터로 설정하거나 현재 블록과 동일한 위치의 후방 참조픽처 내의 블록의 전방 참조블록 움직임 벡터로부터 예측 움직임 벡터를 설정하고, 상기 예측 움직임 벡터를 이용하여 움직임 보상을 수행하고 상기 움직임 보상의 결과가 최적 스킵조건을 만족하면 예측모드를 설정하고 상기 예측모드를 부호화하는 영상 부호화기; 및
    부호화 데이터를 복호화하여 예측모드를 복호하고, 상기 예측모드가 순방향 시간적 확장스킵 모드이면 현재 블록과 동일한 위치의 후방 참조픽처 내의 블록의 전방 참조블록 움직임 벡터와 동일한 방향의 전방 참조블록에 대한 움직임 벡터를 이용하여 현재 블록을 예측하고, 상기 예측모드가 역방향 시간적 확장스킵 모드이면 현재 블록과 동일한 위치의 후방 참조픽처 내의 블록의 전방 참조블록 움직임 벡터와 정반대 방향의 후방 참조블록에 대한 움직임 벡터를 이용하여 현재 블록을 예측하여 예측 블록을 생성하고, 상기 예측모드가 역방향 공간적 확장스킵 모드이면 현재 블록의 주변블록의 후방 참조블록에 대한 움직임 벡터를 이용하여 상기 현재 블록을 예측하여 예측 블록을 생성하는 영상 복호화기
    를 포함하는 것을 특징으로 하는 영상 부호화/복호화 장치.
  2. 영상을 부호화하는 장치에 있어서,
    현재 블록과 동일한 위치의 후방 참조픽처 내의 블록인 앵커블록을 참조하여 상기 앵커블록의 전방 참조블록에 대한 움직임 벡터와 동일한 방향의 전방 참조블록에 대한 움직임 벡터를 예측 움직임 벡터로 설정하고 상기 예측 움직임 벡터를 이용하여 움직임 보상을 수행하고 상기 움직임 보상의 결과가 최적 스킵조건을 만족하면 예측모드를 순방향 시간적 확장스킵 모드로 설정하는 모드결정기; 및
    상기 예측모드를 부호화하는 부호화기
    를 포함하는 것을 특징으로 하는 영상 부호화 장치.
  3. 제 2항에 있어서,
    상기 후방 참조픽처 내의 블록은,
    모든 후방 참조픽처 중에서 상기 현재 블록과 가장 가까운 참조픽처 내의 블록인 것을 특징으로 하는 영상 부호화 장치.
  4. 제 2항에 있어서,
    상기 최적 스킵조건은 상기 순방향 시간적 확장스킵 모드를 포함한 모든 인터예측 가능 모드 집합 내의 인터 예측 모드 후보 각각에 대해 현재 블록을 예측하고 부호화하는 경우에 발생하는 비트량과 왜곡치를 고려하여 상기 순방향 시간적 확장스킵 모드의 율-왜곡 비용이 작은 경우인 것을 특징으로 하는 영상 부호화 장치.
  5. 영상을 부호화하는 장치에 있어서,
    현재 블록과 동일한 위치의 후방 참조픽처 내의 블록인 앵커블록을 참조하여 상기 앵커블록의 전방 참조블록에 대한 움직임 벡터와 정반대 방향의 후방 참조블록에 대한 움직임 벡터를 예측 움직임 벡터로 설정하고 상기 예측 움직임 벡터를 이용하여 움직임 보상을 수행하고 상기 움직임 보상의 결과가 최적 스킵조건을 만족하면 예측모드를 역방향 시간적 확장스킵 모드로 설정하는 모드결정기; 및
    상기 예측모드를 부호화하는 부호화기
    를 포함하는 것을 특징으로 하는 영상 부호화 장치.
  6. 제 5항에 있어서,
    상기 후방 참조픽처 내의 블록은,
    모든 후방 참조픽처 중에서 상기 현재 블록과 가장 가까운 참조픽처 내의 블록인 것을 특징으로 하는 영상 부호화 장치.
  7. 제 5항에 있어서,
    상기 최적 스킵조건은 상기 역방향 시간적 확장스킵 모드를 포함한 모든 인터예측 가능 모드 집합 내의 인터 예측 모드 후보 각각에 대해 현재 블록을 예측하고 부호화하는 경우에 발생하는 비트량과 왜곡치를 고려하여 상기 역방향 시간적 확장스킵 모드의 율-왜곡 비용이 작은 경우인 것을 특징으로 하는 영상 부호화 장치.
  8. 영상을 부호화하는 장치에 있어서,
    현재 블록의 주변블록의 후방 참조블록에 대한 움직임 벡터로부터 상기 현재 블록의 예측 움직임 벡터를 결정하고 상기 예측 움직임 벡터를 이용하여 움직임 보상을 수행하고 상기 움직임 보상의 결과가 최적 스킵조건을 만족하면 예측모드를 역방향 공간적 확장스킵 모드로 설정하는 모드결정기; 및
    상기 예측모드를 부호화하는 부호화기
    를 포함하는 것을 특징으로 하는 영상 부호화 장치.
  9. 제 8항에 있어서,
    상기 최적 스킵조건은 상기 역방향 공간적 확장스킵 모드를 포함한 모든 인터예측 가능 모드 집합 내의 인터 예측 모드 후보 각각에 대해 현재 블록을 예측하고 부호화하는 경우에 발생하는 비트량과 왜곡치를 고려하여 상기 역방향 공간적 확장스킵 모드의 율-왜곡 비용이 작은 경우인 것을 특징으로 하는 영상 부호화 장치.
  10. 제 8항에 있어서,
    상기 후방 참조블록에 대한 움직임 벡터는,
    상기 현재 블록의 주변블록의 후방 참조블록에 대한 움직임 벡터들의 중앙값으로 설정된 것을 특징으로 하는 영상 부호화 장치.
  11. 영상을 복호화하는 장치에 있어서,
    부호화 데이터를 복호화하여 예측모드를 복호하는 복호화기; 및
    상기 예측모드가 순방향 시간적 확장스킵 모드이면, 현재 블록과 동일한 위치의 후방 참조픽처 내의 블록인 앵커블록을 참조하여 상기 앵커블록의 전방 참조블록에 대한 움직임 벡터와 동일한 방향의 전방 참조블록에 대한 움직임 벡터를 이용하여 현재 블록을 예측하여 예측 블록을 생성하는 예측기
    를 포함하는 것을 특징으로 하는 영상 복호화 장치.
  12. 제 11항에 있어서,
    상기 후방 참조픽처 내의 블록은,
    모든 후방 참조픽처 중에서 상기 현재 블록과 가장 가까운 참조픽처 내의 블록인 것을 특징으로 하는 영상 복호화 장치.
  13. 영상을 복호화하는 장치에 있어서,
    부호화 데이터를 복호화하여 예측모드를 복호하는 복호화기; 및
    상기 예측모드가 역방향 시간적 확장스킵 모드이면, 현재 블록과 동일한 위치의 후방 참조픽처 내의 블록의 전방 참조블록 움직임 벡터와 정반대 방향의 후방 참조블록에 대한 움직임 벡터를 이용하여 현재 블록을 예측하여 예측 블록을 생성하는 예측기
    를 포함하는 것을 특징으로 하는 영상 복호화 장치.
  14. 제 13항에 있어서,
    상기 후방 참조픽처 내의 블록은,
    모든 후방 참조픽처 중에서 상기 현재 블록과 가장 가까운 참조픽처 내의 블록인 것을 특징으로 하는 영상 복호화 장치.
  15. 영상을 복호화하는 장치에 있어서,
    부호화 데이터를 복호화하여 예측모드를 복호하는 복호화기; 및
    상기 예측모드가 역방향 공간적 확장스킵 모드이면, 현재 블록의 주변블록의 후방 참조블록에 대한 움직임 벡터를 이용하여 상기 현재 블록을 예측하여 예측 블록을 생성하는 예측기
    를 포함하는 것을 특징으로 하는 영상 복호화 장치.
  16. 제 15항에 있어서,
    상기 후방 참조블록에 대한 움직임 벡터는,
    상기 현재 블록의 주변블록의 후방 참조블록에 대한 움직임 벡터들의 중앙값으로 설정된 것을 특징으로 하는 영상 복호화 장치.
  17. 영상을 부호화/복호화하는 방법에 있어서,
    현재 블록의 주변블록의 후방 참조블록에 대한 움직임 벡터를 상기 현재 블록의 예측 움직임 벡터로 설정하거나 현재 블록과 동일한 위치의 후방 참조픽처 내의 블록의 전방 참조블록 움직임 벡터로부터 예측 움직임 벡터를 설정하고, 상기 예측 움직임 벡터를 이용하여 움직임 보상을 수행하고 상기 움직임 보상의 결과가 최적 스킵조건을 만족하면 예측모드를 설정하고 상기 예측모드를 부호화하는 단계; 및
    부호화 데이터를 복호화하여 예측모드를 복호하고, 상기 예측모드가 순방향 시간적 확장스킵 모드이면 현재 블록과 동일한 위치의 후방 참조픽처 내의 블록의 전방 참조블록 움직임 벡터와 동일한 방향의 전방 참조블록에 대한 움직임 벡터를 이용하여 현재 블록을 예측하고, 상기 예측모드가 역방향 시간적 확장스킵 모드이면 현재 블록과 동일한 위치의 후방 참조픽처 내의 블록의 전방 참조블록 움직임 벡터와 정반대 방향의 후방 참조블록에 대한 움직임 벡터를 이용하여 현재 블록을 예측하여 예측 블록을 생성하고, 상기 예측모드가 역방향 공간적 확장스킵 모드이면 현재 블록의 주변블록의 후방 참조블록에 대한 움직임 벡터를 이용하여 상기 현재 블록을 예측하여 예측 블록을 생성하는 단계
    를 포함하는 것을 특징으로 하는 영상 부호화/복호화 방법.
  18. 영상을 부호화하는 방법에 있어서,
    현재 블록과 동일한 위치의 후방 참조픽처 내의 블록인 앵커블록을 참조하여 상기 앵커블록의 전방 참조블록에 대한 움직임 벡터와 동일한 방향의 전방 참조블록에 대한 움직임 벡터를 예측 움직임 벡터로 설정하고 상기 예측 움직임 벡터를 이용하여 움직임 보상을 수행하고 상기 움직임 보상의 결과가 최적 스킵조건을 만족하면 예측모드를 순방향 시간적 확장스킵 모드로 설정하는 단계; 및
    상기 예측모드를 부호화하는 단계
    를 포함하는 것을 특징으로 하는 영상 부호화 방법.
  19. 제 18항에 있어서,
    상기 후방 참조픽처 내의 블록은,
    모든 후방 참조픽처 중에서 상기 현재 블록과 가장 가까운 참조픽처 내의 블록인 것을 특징으로 하는 영상 부호화 방법.
  20. 제 18항에 있어서,
    상기 최적 스킵조건은 상기 순방향 시간적 확장스킵 모드를 포함한 모든 인터예측 가능 모드 집합 내의 인터 예측 모드 후보 각각에 대해 현재 블록을 예측하고 부호화하는 경우에 발생하는 비트량과 왜곡치를 고려하여 상기 순방향 시간적 확장스킵 모드의 율-왜곡 비용이 작은 경우인 것을 특징으로 하는 영상 부호화 방법.
  21. 영상을 부호화하는 방법에 있어서,
    현재 블록과 동일한 위치의 후방 참조픽처 내의 블록인 앵커블록을 참조하여 상기 앵커블록의 전방 참조블록에 대한 움직임 벡터와 정반대 방향의 후방 참조블록에 대한 움직임 벡터를 예측 움직임 벡터로 설정하고 상기 예측 움직임 벡터를 이용하여 움직임 보상을 수행하고 상기 움직임 보상의 결과가 최적 스킵조건을 만족하면 예측모드를 역방향 시간적 확장스킵 모드로 설정하는 단계; 및
    상기 예측모드를 부호화하는 단계
    를 포함하는 것을 특징으로 하는 영상 부호화 방법.
  22. 제 21항에 있어서,
    상기 후방 참조픽처 내의 블록은,
    모든 후방 참조픽처 중에서 상기 현재 블록과 가장 가까운 참조픽처 내의 블록인 것을 특징으로 하는 영상 부호화 방법.
  23. 제 21항에 있어서,
    상기 최적 스킵조건은 상기 역방향 시간적 확장스킵 모드를 포함한 모든 인터예측 가능 모드 집합 내의 인터 예측 모드 후보 각각에 대해 현재 블록을 예측하고 부호화하는 경우에 발생하는 비트량과 왜곡치를 고려하여 상기 역방향 시간적 확장스킵 모드의 율-왜곡 비용이 작은 경우인 것을 특징으로 하는 영상 부호화 방법.
  24. 영상을 부호화하는 방법에 있어서,
    현재 블록의 주변블록의 후방 참조블록에 대한 움직임 벡터를 상기 현재 블록의 예측 움직임 벡터로 설정하고 상기 예측 움직임 벡터를 이용하여 움직임 보상을 수행하고 상기 움직임 보상의 결과가 최적 스킵조건을 만족하면 예측모드를 역방향 공간적 확장스킵 모드로 설정하는 단계; 및
    상기 예측모드를 부호화하는 단계
    를 포함하는 것을 특징으로 하는 영상 부호화 방법.
  25. 제 24항에 있어서,
    상기 최적 스킵조건은 상기 역방향 공간적 확장스킵 모드를 포함한 모든 인터예측 가능 모드 집합 내의 인터 예측 모드 후보 각각에 대해 현재 블록을 예측하고 부호화하는 경우에 발생하는 비트량과 왜곡치를 고려하여 상기 역방향 공간적 확장스킵 모드의 율-왜곡 비용이 작은 경우인 것을 특징으로 하는 영상 부호화 방법.
  26. 제 24항에 있어서,
    상기 후방 참조블록에 대한 움직임 벡터는,
    상기 현재 블록의 주변블록의 후방 참조블록에 대한 움직임 벡터들의 중앙값으로 설정된 것을 특징으로 하는 영상 부호화 방법.
  27. 영상을 복호화하는 방법에 있어서,
    부호화 데이터를 복호화하여 예측모드를 복호하는 단계; 및
    상기 예측모드가 순방향 시간적 확장스킵 모드이면, 현재 블록과 동일한 위치의 후방 참조픽처 내의 블록인 앵커블록을 참조하여 상기 앵커블록의 전방 참조블록에 대한 움직임 벡터와 동일한 방향의 전방 참조블록에 대한 움직임 벡터를 이용하여 현재 블록을 예측하여 예측 블록을 생성하는 단계
    를 포함하는 것을 특징으로 하는 영상 복호화 방법.
  28. 제 37항에 있어서,
    상기 후방 참조픽처 내의 블록은,
    모든 후방 참조픽처 중에서 상기 현재 블록과 가장 가까운 참조픽처 내의 블록인 것을 특징으로 하는 영상 복호화 방법.
  29. 영상을 복호화하는 방법에 있어서,
    부호화 데이터를 복호화하여 예측모드를 복호하는 단계; 및
    상기 예측모드가 역방향 시간적 확장스킵 모드이면, 현재 블록과 동일한 위치의 후방 참조픽처 내의 블록인 앵커블록을 참조하여 상기 앵커블록의 전방 참조블록에 대한 움직임 벡터와 정반대 방향의 후방 참조블록에 대한 움직임 벡터를 이용하여 현재 블록을 예측하여 예측 블록을 생성하는 단계
    를 포함하는 것을 특징으로 하는 영상 복호화 방법.
  30. 제 39항에 있어서,
    상기 후방 참조픽처 내의 블록은,
    모든 후방 참조픽처 중에서 상기 현재 블록과 가장 가까운 참조픽처 내의 블록인 것을 특징으로 하는 영상 복호화 방법.
  31. 영상을 복호화하는 방법에 있어서,
    부호화 데이터를 복호화하여 예측모드를 복호하는 단계; 및
    상기 예측모드가 역방향 공간적 확장스킵 모드이면, 현재 블록의 주변블록의 후방 참조블록에 대한 움직임 벡터를 이용하여 상기 현재 블록을 예측하여 예측 블록을 생성하는 단계
    를 포함하는 것을 특징으로 하는 영상 복호화 방법.
  32. 제 31항에 있어서,
    상기 후방 참조블록에 대한 움직임 벡터는,
    상기 현재 블록의 주변블록의 후방 참조블록에 대한 움직임 벡터들의 중앙값으로 설정된 것을 특징으로 하는 영상 복호화 방법.
PCT/KR2011/004521 2010-07-22 2011-06-21 확장된 스킵모드를 이용한 영상 부호화/복호화 방법 및 장치 WO2012011672A2 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN2011800457098A CN103141093A (zh) 2010-07-22 2011-06-21 使用扩展跳过模式编码/解码图像的方法和设备
US13/811,602 US20130202039A1 (en) 2010-07-22 2011-06-21 Method and device for encoding/decoding image using extended skip mode

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020100070755A KR20120009861A (ko) 2010-07-22 2010-07-22 확장된 스킵모드를 이용한 영상 부호화/복호화 방법 및 장치
KR10-2010-0070755 2010-07-22

Publications (2)

Publication Number Publication Date
WO2012011672A2 true WO2012011672A2 (ko) 2012-01-26
WO2012011672A3 WO2012011672A3 (ko) 2012-04-12

Family

ID=45497251

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2011/004521 WO2012011672A2 (ko) 2010-07-22 2011-06-21 확장된 스킵모드를 이용한 영상 부호화/복호화 방법 및 장치

Country Status (4)

Country Link
US (1) US20130202039A1 (ko)
KR (1) KR20120009861A (ko)
CN (1) CN103141093A (ko)
WO (1) WO2012011672A2 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110786012A (zh) * 2018-04-02 2020-02-11 深圳市大疆创新科技有限公司 用于图像运动补偿的方法和装置

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2014000159A (es) * 2011-07-02 2014-02-19 Samsung Electronics Co Ltd Metodo y aparato para la codificacion de video, y metodo y aparato para la decodificacion de video acompañada por inter prediccion utilizando imagen co-localizada.
FR2986395A1 (fr) * 2012-01-30 2013-08-02 France Telecom Codage et decodage par heritage progressif
CN103338372A (zh) * 2013-06-15 2013-10-02 浙江大学 一种视频处理方法及装置
US10244167B2 (en) 2016-06-17 2019-03-26 Gopro, Inc. Apparatus and methods for image encoding using spatially weighted encoding quality parameters
CN106375769B (zh) * 2016-08-31 2019-04-30 西安万像电子科技有限公司 图像特征搜索方法和装置、存储介质及处理器
EP3713236A4 (en) * 2017-12-14 2021-04-21 LG Electronics Inc. METHOD AND DEVICE FOR DECODING IMAGE ACCORDING TO INTER-PREDICTION IN AN IMAGE CODING SYSTEM
AU2019292471A1 (en) * 2018-06-30 2021-01-28 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Merge mode-based inter-prediction method and apparatus
WO2020096898A1 (en) * 2018-11-05 2020-05-14 Interdigital Vc Holdings, Inc. Video encoding or decoding using block extension for overlapped block motion compensation
CN110072112B (zh) * 2019-03-12 2023-05-12 浙江大华技术股份有限公司 帧内预测方法、编码器及存储装置
CN114339231B (zh) * 2021-12-27 2023-10-27 杭州当虹科技股份有限公司 利用运动矢量快速跳Cu级模式选择的方法
CN116168790B (zh) * 2023-04-25 2023-07-14 深圳爱递医药科技有限公司 一种临床试验的大数据招募系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100905059B1 (ko) * 2007-08-16 2009-06-30 한국전자통신연구원 동영상 부호화에 있어서 비트 발생 가능성 예측을 이용한블록 모드 결정 방법 및 장치
KR20100014553A (ko) * 2007-04-25 2010-02-10 엘지전자 주식회사 비디오 신호의 인코딩/디코딩 방법 및 장치
KR100951164B1 (ko) * 2008-01-28 2010-04-06 울산대학교 산학협력단 윤곽선을 이용한 h.264/avc의 효율적인 고속 모드결정 방법

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69031107T2 (de) * 1989-10-14 1997-11-13 Sony Corp Anordnung und Verfahren zum Übertragen eines Videosignals
GB9928022D0 (en) * 1999-11-26 2000-01-26 British Telecomm Video coding and decording
US7003035B2 (en) * 2002-01-25 2006-02-21 Microsoft Corporation Video coding methods and apparatuses
JP2004088722A (ja) * 2002-03-04 2004-03-18 Matsushita Electric Ind Co Ltd 動画像符号化方法および動画像復号化方法
EP3324625B1 (en) * 2002-04-19 2019-06-12 Panasonic Intellectual Property Corporation of America Motion vector calculating method
KR100865034B1 (ko) * 2002-07-18 2008-10-23 엘지전자 주식회사 모션 벡터 예측 방법
US8854486B2 (en) * 2004-12-17 2014-10-07 Mitsubishi Electric Research Laboratories, Inc. Method and system for processing multiview videos for view synthesis using skip and direct modes
KR101003105B1 (ko) * 2008-01-29 2010-12-21 한국전자통신연구원 어파인 변환 기반의 움직임 보상을 이용한 비디오 부호화 및 복호화 방법 및 장치
KR101505195B1 (ko) * 2008-02-20 2015-03-24 삼성전자주식회사 직접 모드 부호화 및 복호화 방법
KR101619972B1 (ko) * 2008-10-02 2016-05-11 한국전자통신연구원 이산 여현 변환/이산 정현 변환을 선택적으로 이용하는 부호화/복호화 장치 및 방법
WO2011075096A1 (en) * 2009-12-15 2011-06-23 Thomson Licensing Method and apparatus for bi-directional prediction within p-slices

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100014553A (ko) * 2007-04-25 2010-02-10 엘지전자 주식회사 비디오 신호의 인코딩/디코딩 방법 및 장치
KR100905059B1 (ko) * 2007-08-16 2009-06-30 한국전자통신연구원 동영상 부호화에 있어서 비트 발생 가능성 예측을 이용한블록 모드 결정 방법 및 장치
KR100951164B1 (ko) * 2008-01-28 2010-04-06 울산대학교 산학협력단 윤곽선을 이용한 h.264/avc의 효율적인 고속 모드결정 방법

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110786012A (zh) * 2018-04-02 2020-02-11 深圳市大疆创新科技有限公司 用于图像运动补偿的方法和装置
US11871032B2 (en) 2018-04-02 2024-01-09 SZ DJI Technology Co., Ltd. Method and device for image motion compensation
CN110786012B (zh) * 2018-04-02 2024-01-30 深圳市大疆创新科技有限公司 用于图像运动补偿的方法和装置
US11949912B2 (en) 2018-04-02 2024-04-02 SZ DJI Technology Co., Ltd. Method and device for video image processing
US11949911B2 (en) 2018-04-02 2024-04-02 SZ DJI Technology Co., Ltd. Method and device for obtaining motion vector of video image
US11997312B2 (en) 2018-04-02 2024-05-28 SZ DJI Technology Co., Ltd. Method and device for video image processing

Also Published As

Publication number Publication date
US20130202039A1 (en) 2013-08-08
CN103141093A (zh) 2013-06-05
WO2012011672A3 (ko) 2012-04-12
KR20120009861A (ko) 2012-02-02

Similar Documents

Publication Publication Date Title
WO2012011672A2 (ko) 확장된 스킵모드를 이용한 영상 부호화/복호화 방법 및 장치
WO2010050706A2 (ko) 움직임 벡터 부호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
WO2013002549A2 (ko) 영상 부호화/복호화 방법 및 장치
WO2011145819A2 (ko) 영상 부호화/복호화 장치 및 방법
WO2013070006A1 (ko) 스킵모드를 이용한 동영상 부호화 및 복호화 방법 및 장치
WO2010027182A2 (ko) 서브블록 내 임의 화소를 이용한 영상 부호화/복호화 방법 및 장치
WO2013109039A1 (ko) 가중치예측을 이용한 영상 부호화/복호화 방법 및 장치
WO2012099440A2 (ko) 예측 움직임벡터 색인부호화에 기반한 움직임정보 생성/복원 장치 및 방법, 및 그것을 이용한 영상 부호화/복호화 장치 및 방법
WO2013005941A2 (ko) 영상 부호화 및 복호화 방법과 장치
WO2011031030A2 (ko) 움직임 벡터 부호화/복호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
WO2011068331A2 (ko) 비디오 인코딩 장치 및 그 인코딩 방법, 비디오 디코딩 장치 및 그 디코딩 방법, 및 거기에 이용되는 방향적 인트라 예측방법
WO2011062392A2 (ko) 후보 예측 움직임 벡터 집합 선택을 이용한 움직임 벡터 부호화/복호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
WO2012077960A2 (ko) 임의의 형태의 블록을 이용한 인터예측에 의한 영상의 부호화/복호화 방법 및 장치
WO2013002550A2 (ko) 고속 코딩 단위(Coding Unit) 모드 결정을 통한 부호화/복호화 방법 및 장치
WO2011142603A2 (ko) 영상의 필터링 방법 및 장치와 그를 이용한 부호화/복호화를 위한 방법 및 장치
WO2012096550A2 (ko) 양방향 인트라 예측을 이용한 영상 부호화/복호화 방법 및 장치
WO2011004986A2 (ko) 영상 부호화/복호화 방법 및 장치
WO2010038961A2 (ko) 복수 개의 움직임 벡터 추정을 이용한 움직임 벡터 부호화/복호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
WO2011037337A2 (ko) 저주파수 성분을 고려한 영상 부호화/복호화 방법 및 장치
WO2009157665A2 (ko) 블록 변환을 이용한 인트라 예측 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
WO2012046979A2 (ko) 주파수 마스크 테이블을 이용한 주파수변환 블록 부호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
WO2013069996A1 (ko) 변환을 이용한 주파수 도메인 상의 적응적 루프 필터를 이용한 영상 부호화/복호화 방법 및 장치
WO2012015275A2 (ko) 블록 분할예측을 이용한 영상 부호화/복호화 방법 및 장치
WO2012033344A2 (ko) 효과적인 화면내 예측모드 집합 선택을 이용한 영상 부호화/복호화 방법 및 장치
WO2011108879A2 (ko) 영상 부호화 장치, 그 영상 부호화 방법, 영상 복호화 장치 및 그 영상 복호화 방법

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 201180045709.8

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 11809799

Country of ref document: EP

Kind code of ref document: A2

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 13811602

Country of ref document: US

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: NOTING OF LOSS OF RIGHTS (EPO F1205A DATED 17-05-2013)

122 Ep: pct application non-entry in european phase

Ref document number: 11809799

Country of ref document: EP

Kind code of ref document: A2