WO2013058445A1 - Distributed video encoding/decoding methods for changing a picture group structure, and apparatus for performing same - Google Patents

Distributed video encoding/decoding methods for changing a picture group structure, and apparatus for performing same Download PDF

Info

Publication number
WO2013058445A1
WO2013058445A1 PCT/KR2012/001502 KR2012001502W WO2013058445A1 WO 2013058445 A1 WO2013058445 A1 WO 2013058445A1 KR 2012001502 W KR2012001502 W KR 2012001502W WO 2013058445 A1 WO2013058445 A1 WO 2013058445A1
Authority
WO
WIPO (PCT)
Prior art keywords
frame
mode
key
jib
mode determination
Prior art date
Application number
PCT/KR2012/001502
Other languages
French (fr)
Korean (ko)
Inventor
전병우
심동규
민경연
Original Assignee
성균관대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 성균관대학교 산학협력단 filed Critical 성균관대학교 산학협력단
Publication of WO2013058445A1 publication Critical patent/WO2013058445A1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/395Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability involving distributed video coding [DVC], e.g. Wyner-Ziv video coding or Slepian-Wolf video coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/114Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]

Definitions

  • the present invention relates to a distributed video encoding / decoding method for changing the structure of a picture group, and more particularly, to a video encoding and decoding method and an apparatus for performing such a method.
  • a distributed video encoder / decoder method capable of low complexity and low power consumption has been proposed and developed for personal broadcasting in an environment having limited computational processing capability and battery performance.
  • the distributed video method performs encoding by dividing a key frame and a WZ frame.
  • the key frame is encoded and reconstructed by a prediction encoding / decoding method in an existing video screen.
  • the Weiner jib frame is encoded through the channel encoder and restored by channel decoding the auxiliary information generated using the key frame.
  • the performance of the distributed video coder is highly affected by the performance of the auxiliary information, and the performance of the auxiliary information varies from frame to frame, making it difficult to predict in a distributed video encoder.
  • a picture group (GOP) structure of a distributed video coder is performed by setting a minimum unit, that is, picture group size to 2.
  • a first object of the present invention is to provide a distributed video encoding method for adaptively changing the structure of a picture group.
  • Another object of the present invention is to provide an apparatus for performing a distributed video encoding method for adaptively changing a structure of a picture group.
  • the distributed video encoding method may further include generating the mode determination frame in at least one frame mode of a predictive wine jib frame and a predictive key frame.
  • the predicted Weiner Jib frame may be generated based on Weiner Jib frame prediction information provided by a distributed video decoding apparatus.
  • the method may further include encoding the mode determining frame into at least one frame mode of a wine jib frame or a key frame by comparing the predicted Weiner jib frame rate distortion with the predicted key frame rate distortion.
  • a frame mode having a small rate distortion among the predicted key frames may be determined.
  • the mode determination frame may be present at an intermediate position of a first key frame, which is the first frame, and a second key frame, which is the last frame, or at a position added or subtracted from the middle in a predetermined picture group structure.
  • the mode decision frame when the mode decision frame is encoded as a key frame, one of the mode decision frame and the first key frame is located at an intermediate position or an intermediate position of the mode determination frame and the first key frame.
  • the method may further include resetting to a frame.
  • the predicted key frame rate distortion may be linearly predicted based on a previously generated predicted key frame rate distortion value.
  • the distributed video encoding method for achieving the above-described second object of the present invention includes predicted Weiner jib frame rate distortion, predictive key frame rate distortion, and skip mode frame of a mode determination frame for determining an encoding mode.
  • the method may include encoding in a mode.
  • the distributed video encoding method may further include generating the predetermined frame in at least one frame mode of a predictive wine jib frame, a predictive key frame, and a skip mode frame. Encoding the mode determination frame into at least one frame mode among a wine zeb frame, a key frame, and a skip mode frame by comparing the predicted Weiner jib frame rate distortion, the rate distortion of the predictive key frame, and the skip mode frame rate distortion.
  • the mode determining frame may be determined as a frame mode having a small rate distortion among the prediction winener jib frame, the prediction key frame, and the skip mode frame.
  • the mode determination frame may be a frame existing in a middle position of a first key frame, which is a first frame, and a second key frame, which is a last frame, or at a position added or subtracted from the middle, in a predetermined picture group structure. .
  • the mode decision frame when the mode decision frame is encoded as a key frame, one of the mode decision frame and the first key frame is located at an intermediate position or an intermediate position of the mode determination frame and the first key frame.
  • the method may further include resetting to a frame.
  • the prediction key frame rate distortion may be linearly predicted based on the rate distortion value of the previously generated prediction key frame.
  • a distributed video encoding apparatus determines a distributed video mode of a mode determination frame, which is a frame for determining an encoding mode, to perform distributed video encoding. It may include a picture group structure determiner for determining the structure of and a distributed video encoder for performing distributed video encoding based on the picture group structure determined by the picture group structure determiner.
  • the picture group structure determiner includes: a first winey jib frame generator configured to generate a predicted winery jib frame of the mode determination frame; the predicted winery jib frame rate distortion generated by the first winery jib frame generator; and the distributed video encoder A rate distortion measuring unit comparing the rate distortion of the predictive key frame of the predetermined frame and the predicted wine jib frame rate distortion and the rate distortion of the predicted key frame to determine an encoding mode of the predetermined frame
  • the apparatus may further include a mode determiner. When the mode determination frame is encoded as a key frame, the picture group structure determination unit determines the mode determination frame based on the mode determination frame and the first key frame based on a first key frame in the output order of the frames in the predetermined picture group structure.
  • the mode based on a frame existing at a middle position of the first key frame or a position added or subtracted from one of the intermediate positions and a second key frame which is the last frame in the output order of the frames in the mode determination frame and the predetermined picture group structure;
  • the frame existing at the intermediate position or the intermediate position of the determination frame and the second key frame may be reset to the mode determination frame.
  • the picture group structure determiner comprises: a first winey jib frame generator configured to generate a predicted Weiner jib frame of the mode determination frame; a skip mode frame generator configured to generate a skip mode frame of the mode determined frame; A rate distortion measuring unit for comparing a skip mode frame and a rate distortion of a predictive key frame of the mode determination frame generated by the distributed video encoder, the predictive wier jib frame measured from the rate distortion measuring unit, and the predictive key frame;
  • the apparatus may further include a mode determiner configured to determine the encoding mode of the predetermined frame by comparing the rate distortion of the skip mode frame.
  • the distributed video decoding apparatus for achieving the above-described fourth object of the present invention is provided with a key frame decoding unit for receiving key frame prediction information and reconstructing a key frame.
  • a second winery jib frame generation unit configured to generate a winery jib frame based on the winery jib prediction information generated through a predetermined screen prediction method based on a key frame, wherein the second winery jib frame generation unit comprises: May be provided to a distributed video encoder.
  • the distributed video decoding apparatus further includes a preprocessing unit configured to receive encoding information of a mode determination frame, which is a frame for determining an encoding mode, from the distributed video encoder, and to perform transformation and quantization when the mode determination frame is determined to be a wine jib frame. can do.
  • a preprocessing unit configured to receive encoding information of a mode determination frame, which is a frame for determining an encoding mode, from the distributed video encoder, and to perform transformation and quantization when the mode determination frame is determined to be a wine jib frame. can do.
  • the key frame and the wine jib frame may be adaptively adapted according to the nature of the image sequence.
  • the configured GOP Group of Picture
  • FIG. 1 is a conceptual diagram illustrating a distributed video encoding apparatus and a decoding apparatus according to an embodiment of the present invention.
  • FIG. 2 is a conceptual diagram illustrating a method of forming a GOP structure according to an embodiment of the present invention.
  • FIG. 3 shows a distributed video encoding apparatus and a distributed video decoding apparatus according to another embodiment of the present invention.
  • FIG. 4 is a flowchart illustrating a method of determining an encoding mode of a frame according to another embodiment of the present invention.
  • FIG. 5 is a flowchart illustrating a method of determining an encoding mode of a frame according to another embodiment of the present invention.
  • first and second may be used to describe various components, but the components should not be limited by the terms. The terms are used only for the purpose of distinguishing one component from another.
  • the first component may be referred to as the second component, and similarly, the second component may also be referred to as the first component.
  • a key frame in a state predicted through a predetermined screen prediction method to generate a key frame is defined as a predicted key frame. That is, a key frame may be generated by adding a residual value, which is a difference between the key frame and the predicted key frame, to the predicted key frame.
  • a predictive key frame may be generated based on the key frame prediction information transmitted from the distributed video encoder, and a key frame may be generated by adding a residual value to the generated predicted key frame.
  • the Weiner Jib frame of the predicted state is defined as an auxiliary information frame.
  • An auxiliary information frame may be generated as a wine jib frame based on the parity information transmitted from the encoder.
  • the Weiner jib frame predicted based on the predetermined prediction information in the encoder is defined as a prediction auxiliary information frame
  • the Weiner jib frame generated based on the prediction auxiliary information frame in the encoder is called a predicted winener jib frame.
  • the prediction key frame uses the intra prediction method and the auxiliary information frame and the prediction auxiliary information frame use the inter prediction method.
  • the auxiliary information frame and the prediction auxiliary information frame may use intra prediction.
  • the intra prediction is performed in generating a prediction key frame.
  • the prediction may be performed by using inter prediction using a predetermined prediction key frame, and the auxiliary information frame and the prediction auxiliary information frame are also impossible to inter prediction, the intra prediction is performed.
  • the auxiliary information frame and the predictive auxiliary information frame can be generated through.
  • the picture and the frame are used in the same meaning.
  • FIG. 1 is a conceptual diagram illustrating a distributed video encoding apparatus and a decoding apparatus according to an embodiment of the present invention.
  • a distributed video encoding apparatus may include a picture group (GOP) structure determiner 110 and a distributed video encoder 130.
  • GOP picture group
  • the picture group structure determiner 110 and the distributed video encoder 130 are described in separate configurations for convenience of description, but the picture group structure determiner 110 and the distributed video encoder 130 are described. ) May be implemented in one configuration.
  • the picture group structure determiner 110 may determine a structure of a picture group in which distributed video encoding is performed by determining a distributed video mode of a mode determination frame, which is a frame for determining an encoding mode, and the distributed video encoder 130 may determine a picture. Distributed video encoding may be performed based on the picture group structure determined by the group structure determiner.
  • the picture group structure determiner 110 may include a prediction auxiliary information frame generator 113, a predictive wine jib frame generator 116, a rate distortion measurer 120, and a mode determiner 125.
  • the video encoder 130 may include a key frame encoder 135, a preprocessor 140, and a channel encoder 145.
  • the picture group structure determiner 110 may determine a structure of a key frame and a wine jib frame encoded in one picture group unit.
  • the basic structure of the picture group unit may be composed of two key frames and a wine jib frame included between the two key frames.
  • the picture group structure determiner 110 may adaptively determine the picture group structure.
  • the picture group structure determiner 110 generates a predictive wine jib frame generated based on the prediction auxiliary information frame with respect to the predetermined frame, compares it with the rate distortion of the key frame, and selects the predetermined frame according to the rate distortion. It is possible to adaptively change the picture group structure by selecting whether to encode or encode to a key frame.
  • the picture group structure may be changed using a method of adding a skip mode frame using skip mode prediction as well as a wine jib frame and a key frame to the picture group structure.
  • FIG. 2 is a conceptual diagram illustrating a method of forming a group of pictures (GOP) structure according to an embodiment of the present invention.
  • the initial picture group structure may be a picture group structure having K frames from the first frame to the K-th frame.
  • a term indicating a first key frame in an output order in a predetermined picture group structure is referred to as a first key frame and a term indicating a last key frame is referred to as a second key frame. It is defined as.
  • the first key frame 200 as the first frame and the second key frame 250 as the last frame may be encoded in the key frame mode.
  • the picture group structure determination unit 110 determines whether to encode the mode determination frame 230, which is a frame located between the first key frame 200 and the second key frame 250, as a wine jib frame or a key frame. You can decide.
  • a frame existing between the first key frame 200 as the first key frame and the second key frame 250 as the last key frame in the predetermined picture group structure may be selected as a mode determination frame ( 230).
  • a frame having K divided by 2 or K divided by 2 plus 1 or subtracted in the order of frame output may be a mode determining frame
  • K A frame having a value obtained by adding one value and dividing it in half may be a mode determining frame. That is, the position of the mode determination frame can be changed unless it is contrary to the nature of the present invention to adaptively change the picture group structure.
  • a screen prediction method such as an inter prediction method based on the first key frame 200 and the second key frame 250 in order to determine whether to encode the mode determination frame 230 into a Weiner jib frame or a key frame.
  • the mode determination frame 230 may be generated as a predictive wine jib frame using.
  • the mode determination frame 230 generated as the predicted winener jib frame compares the rate distortion between the case in which the mode determination frame 230 is the key frame and the case in which the mode determination frame 230 is the predicted wine jib frame.
  • predetermined prediction information used to generate an auxiliary information frame in the distributed video decoder may be used.
  • the distributed video encoder may generate the prediction auxiliary information frame through the screen prediction method without using the prediction auxiliary information frame generation information transmitted from the distributed video decoder. It is possible.
  • the rate distortion measurement unit may include the rate distortion of the mode decision frame 230 generated as the predictive wine jib frame and the rate distortion when the mode decision frame 230 is a key frame.
  • the mode determiner 125 encodes the mode decision frame 230 as a wine jib frame or a key frame based on the rate distortion measured by the rate distortion measurement unit 120. You can decide. For example, a method of encoding the mode determination frame 230 may be selected as a frame having a relatively smaller rate distortion.
  • the encoding method of the mode determination frame 230 may be determined through a predetermined estimation method without directly generating the mode determination frame 230 as a predictive wine jib frame or a key frame.
  • the picture group structure When it is determined through the mode determination unit 120 that the mode determination frame 230 is encoded as a wine jib frame, the picture group structure has a first key frame as a first frame and a second key frame as a K th frame as key frames. Frames that are encoded and between the remaining first key frame and the second key frame may be determined as a picture group structure having K frames that are encoded as a wine jib frame. If it is determined that the mode determination frame 230 is encoded as a key frame instead of a wine jib frame, the first key frame and the mode determination frame and the frames belonging therebetween are again made into one picture group unit.
  • the picture group structure can be changed by using two key frames and frames belonging to each other in the unit of one picture group.
  • the GOP structure is changed to change the first frame to the first key frame, and the mode determination frame to the second key frame.
  • the procedure for deciding whether a new mode decision frame, which is an intermediate frame, is to be a wine jib frame or a key frame, can be performed in the same manner as described above, and similarly, the second key frame is set again as the first frame.
  • the above-described procedure of determining whether to encode a new mode determining frame, which is an intermediate frame between the first key frame and the second key frame, as a wine jib frame or a key frame can be performed in the second key frame. .
  • a picture group structure can be formed adaptively differently with respect to an image sequence to perform distributed video encoding.
  • the picture group structure determiner 110 measures the rate distortion of the skip mode frame when measuring the rate distortion to add the current frame to a wine jib frame, a key frame, and a skip mode frame. At least one frame may be selected.
  • the skip mode frame is a frame that performs a predetermined screen prediction to generate a prediction frame but does not generate parity bit information or residual value information for reconstructing the same as the original image, or is previously decoded or previously decoded without performing prediction.
  • the frame may be output using the same pixel value as the output frame.
  • the GOP structure may be determined as a GOP structure having K frames that are encoded and compared with rate distortion of the frames between the first and the K th frames so as to be encoded as either a wine jib frame or a skip mode frame.
  • the first frame and the K-th frame are encoded as key frames
  • the mode determination frame existing between the first frame and the K-th frame is determined to be encoded as a key frame instead of a wine jib frame or skip mode frame. If the mode decision frame is located in the middle of the new picture group structure, the mode decision frame is placed in the middle of the key frame, the wine jib frame, or the skip mode frame. It may be determined whether to encode a frame.
  • the picture group structure determiner 110 may include a prediction auxiliary information frame generator 113, a prediction wine jib frame generator 116, and a rate distortion measurer to perform a picture group structure determination method. 120, the mode determiner 125 may be included.
  • the prediction assistance information frame generator 115 may generate the prediction assistance information frame based on the prediction assistance information frame generation information transmitted from the distributed video decoding apparatus 150.
  • the auxiliary information frame generator 160 of the distributed video decoding apparatus 150 may generate an auxiliary information frame by performing a screen prediction method such as inter-screen prediction based on a key frame.
  • the predetermined prediction information used to generate the auxiliary information frame in the distributed video decoding apparatus 150 may be transmitted to the prediction auxiliary information frame generator 113 of the distributed video encoding apparatus 100, and generates the prediction auxiliary information frame.
  • the unit 113 may generate the prediction auxiliary information frame in the same manner as the auxiliary information frame is generated by the distributed video decoding apparatus.
  • an auxiliary information frame and a prediction auxiliary information frame may be generated in the same manner.
  • the prediction assistance information frame generator 113 may generate the prediction assistance information frame based on a key frame through a predetermined screen prediction method. That is, the prediction auxiliary information frame may be generated without the prediction auxiliary information frame generation information transmitted from the auxiliary information frame generator 160 of the distributed video decoding apparatus 150.
  • the rate distortion measurement unit 120 may measure the rate distortion of the predicted wine jib frame and the rate distortion of the key frame generated for the mode change frame.
  • the parity bit may be transmitted so that all errors may be corrected only in a region where the Weiner jib frame does not become zero when quantization is performed in the distributed video encoder.
  • the area that does not become zero may mean an area where the transformed DCT coefficient does not become zero when DCT (Discrete Cosine Transform) is performed in the preprocessing device 140. In this case, it may mean an area in which the pixel value does not become zero.
  • a frame that can be reconstructed based on the parity bits transmitted from the channel encoder 145 is the same as the original image only in a region that is not zero through quantization. . Therefore, by measuring the error of the zero region after quantization, it is possible to predict the distortion value of the wine jib frame.
  • an auxiliary information frame is quantized to restore a prediction auxiliary information frame for a zero region, and a non-zero region is restored to the same as an original frame after quantization. You can create the same wine jib frame and compare the rate distortions based on it.
  • a prediction key frame may be generated by performing intra prediction within an allowable complexity of the distributed video encoding apparatus. According to the complexity allowed in the distributed video encoding apparatus, a predictive key frame for a predetermined frame may be generated directly. However, in the case of encoding with low complexity, the key frame is directly measured to measure the rate distortion value of the key frame. It is possible to estimate the rate distortion when the current frame is key framed by using two key frames that are closest to each other in time with the current frame without generating a. For example, in general, it can be assumed that the bit rate and distortion between frames change linearly in a short period, so the rate distortion when keyframe the current frame is proportional to the distance between the two key frames. It can be found as one weighted sum.
  • the mode determiner 125 may determine whether to encode the mode decision frame into a wine jib frame or a key frame based on the rate distortion measured by the rate distortion measurer 120.
  • the distributed video encoder 130 may encode a key frame and a wine jib frame in a predetermined frame based on the picture group structure determined by the picture group structure determiner 110.
  • the key frame encoder 135 may perform key frame encoding on a frame determined to be encoded as a key frame in the picture group structure.
  • Key frame encoding uses a prediction method such as a mode that performs prediction, such as an intra picture prediction method used in a conventional video encoding method such as H.264 / AVC or HEVC, or a mode that does not perform PCM mode prediction. can do.
  • the line processor 140 may convert and quantize the wine jib frame.
  • a transform method such as a discrete cosine transform (DCT) or a discrete sine transform (DST) may be used, and may be quantized based on a predetermined quantization parameter after the transform.
  • DCT discrete cosine transform
  • DST discrete sine transform
  • the channel encoder 145 performs encoding such as Low Density Parity Check (LDPC) coding or Turbo coding to generate parity bits to generate parity bits for the wine jib frame and to distribute the generated parity bits.
  • LDPC Low Density Parity Check
  • Turbo Turbo Coding
  • the distributed video decoding apparatus 150 may include a key frame decoder 155, an auxiliary information frame generator 160, a line processor 165, a channel code decoder 170, and an image reconstructor 175.
  • the key frame decoder 155 may decode the key frame based on the key frame information encoded by the key frame encoder 135. For example, from the distributed video encoder 130, key frame prediction information (for example, intra prediction mode information) used for generating a predictive key frame and a residual value that is difference information between the predicted key frame and the key frame are obtained from the distributed video encoder 130. The received key frame can be recovered and the restored key frame can be output based on the received key frame.
  • key frame prediction information for example, intra prediction mode information
  • intra prediction mode information used for generating a predictive key frame
  • the auxiliary information frame generator 160 may generate an auxiliary information frame based on the key frame value generated by the key frame decoder. For example, an auxiliary information frame may be generated by performing inter prediction using at least one key frame. In addition, the auxiliary information frame generator 160 transmits the predetermined prediction information used to generate the auxiliary information frame to the prediction auxiliary information frame generator 113 of the distributed video encoder 130 to distribute the video in the distributed video encoding apparatus. The same winery jib frame may be generated as in the decoding apparatus 150.
  • the auxiliary information frame generation unit 160 may receive information about whether the current frame is determined to be encoded as a wine jib frame from the distributed video encoding apparatus.
  • the preprocessor 165 may perform transformation and quantization based on the auxiliary information frame generated by the auxiliary information frame generator 160.
  • the preprocessing unit 165 may perform preprocessing on only the frame determined as the wine jib frame in the picture group structure based on the predetermined information transmitted from the auxiliary information frame generation unit 160.
  • the channel decoder 170 determines whether an error has occurred in the auxiliary information frame based on the parity bit transmitted from the channel encoder 145, and requests the channel encoder 145 for parity bits for correcting the error. Can be.
  • a wine zig frame may be generated by correcting an error of the auxiliary information frame based on the parity bits.
  • the image reconstructor 175 may reconstruct and output the inverse transform and inverse quantization on the Weiner jib frame.
  • FIG. 3 shows a distributed video encoding apparatus and a distributed video decoding apparatus according to another embodiment of the present invention.
  • the distributed video encoding apparatus may include a picture group structure determiner 310 and a distributed video encoder 330.
  • the picture group structure determiner 310 may further include a skip mode frame generator 317 which generates a skip mode frame in the picture group structure determiner 310 described above with reference to FIG. 1.
  • the skip mode frame is a frame that directly outputs a predicted frame without generating parity bit information or residual value information for generating a predictive key frame or an auxiliary information frame by restoring a predetermined screen prediction and reconstructing the same as the original image. It may be a frame output using the same pixel value as a frame previously decoded or previously output without performing prediction.
  • a skip mode frame generation method is called a skip prediction method for convenience of description.
  • the first key frame and the second key frame as the last frame may be encoded in the key frame mode.
  • the picture group structure determiner 310 may determine whether to encode a mode determination frame, which is an intermediate frame between the first key frame and the second key frame, as a wine jib frame, a key frame, or a skip mode frame. Predict the mode decision frame based on the first key frame and the second key frame to determine whether to encode the mode decision frame into a Weiner jib frame, a key frame, or a skip mode frame. You can create a skip mode frame using the method.
  • the rate distortion measurement unit 320 measures rate distortion of each frame based on the generated predicted wine jib frame, key frame, and skip mode frame.
  • the mode determiner 325 may determine whether to encode a current frame into a wine jib frame, a key frame, or a skip mode frame.
  • the distributed video encoder 330 may include a key frame encoder 335, a preprocessor 340, and a channel encoder 345.
  • the role of each component is the same as described above with reference to FIG. 1, but when the frame is determined as the skip mode frame, the residual value information or the parity bit information of the corresponding frame may not be transmitted.
  • the distributed video decoding apparatus 350 includes a key frame decoder 355, an auxiliary information frame generator 360, a preprocessor 365, a channel code decoder 370, and an image reconstruction unit as described above with reference to FIG. 1. 375 may be included and the function of each component is the same as described above in FIG.
  • the key frame encoder of the distributed video encoder 330 Receives only key frame prediction information (eg, intra prediction mode) for generating the predicted key frame generated in step 335, and generates and outputs a predictive key frame based on the key frame prediction information in the distributed video decoding apparatus 350. can do.
  • the skip prediction frame is a frame generated by performing an inter prediction based on a key frame to generate an auxiliary information frame but not generating parity information
  • the prediction generated by the auxiliary information frame generator 360 Outputs the Winner Jib Frame directly.
  • a skip mode frame when the skip mode frame is a frame that uses the same pixel value information as the previously predicted predetermined frame information, the predetermined indication information (for example, information indicating which frame and the same pixel value are to be used). ), A skip mode frame may be output.
  • FIG. 4 is a flowchart illustrating a method of determining an encoding mode of a frame according to another embodiment of the present invention.
  • a predetermined frame is generated as a predictive wine jib frame or a key frame (step S400).
  • a predetermined frame may be generated as a predictive wine jib frame and a key frame.
  • step S400 may not be performed or only one frame of the predicted wine jib frame and the key frame may be generated.
  • Rate distortion of the predictive wine jib frame and the key frame is obtained (step S410).
  • the direct rate distortion can be calculated as described above, and the rate distortion can be calculated without generating the direct key frame or the Weiner jib frame using a specific rate distortion prediction method. Can be.
  • the rate distortion of the calculated key frame and the rate distortion of the predicted wine jib frame are compared (step S420).
  • the current frame is encoded in an encoding mode with a small rate distortion (step S430).
  • rate distortion between the predicted wine jib frame and the key frame may be compared to determine and encode the current frame into a frame having a smaller rate distortion.
  • the picture structure may be determined by performing the procedure of FIG. 4 again in the new picture group structure determined based on the generated key frame.
  • FIG. 5 is a flowchart illustrating a method of determining an encoding mode of a frame according to another embodiment of the present invention.
  • a predetermined frame is generated as a predictive wine jib frame, a key frame, and a skip mode frame (step S500).
  • a predetermined frame is generated as a predictive wine jib frame, a key frame, or a skip mode frame.
  • the rate distortion may be predicted and obtained without generating at least one of the predicted wine jib frame, the key frame, and the skip mode frame, an operation for generating some frames may not be performed in step S500.
  • Rate distortion of the generated predictive wine jib frame, key frame and skip mode frame is obtained (step S510).
  • the rate distortion can be calculated by generating a direct frame as described above, and the direct key frame or predictive wine jib frame can be calculated using a specific rate distortion prediction method. Rate distortion can be calculated without generating.
  • the calculated rate distortion rate of the key frame, the rate distortion rate of the predicted wine jib frame, and the rate distortion rate of the skip mode frame are compared (step S520).
  • the current frame is encoded in an encoding mode with a small rate distortion (step S530).
  • the rate distortion rate of the predictive wine jib frame is the smallest, encode the current frame as a wine jib frame, and if the rate distortion of the key frame is the smallest, encode the current frame as the key frame, and if the rate distortion of the skip mode frame is the smallest, then Is encoded in a skip mode frame.
  • the rate distortion rates of the predictive wine jib frame, the predictive key frame, and the skip mode frame may be compared to determine and generate the current frame as a frame having a relatively low rate distortion.
  • the picture group structure may be determined by performing the procedure of FIG. 4 again based on the generated key frame.

Abstract

The present invention relates to distributed video encoding/decoding methods for changing a picture group structure, and an apparatus for performing same. The distributed video encoding method includes the steps of: obtaining a predicted Wyner-ziv frame rate-distortion and a key frame rate-distortion of a mode determination frame which determines a coding mode; and comparing the predicted Wyner-ziv frame rate-distortion and the key frame rate-distortion to encode the mode determination frame in at least one frame mode of the Wyner-ziv frame and key frame. Accordingly, a high coding efficiency can be achieved by changing a GOP (Group of Picture) in performing the distributed video coding.

Description

픽쳐 그룹의 구조를 변화시키는 분산 비디오 부호화/복호화 방법 및 이러한 방법을 수행하는 장치Distributed video encoding / decoding method for changing the structure of picture group and apparatus for performing such method
본 발명은 픽쳐 그룹의 구조를 변화시키는 분산 비디오 부호화/복호화 방법 및 이러한 방법을 수행하는 장치에 관한 것으로 더욱 상세하게는 비디오 부호화 및 복호화 방법 및 이러한 방법을 수행하는 장치에 관한 것이다.The present invention relates to a distributed video encoding / decoding method for changing the structure of a picture group, and more particularly, to a video encoding and decoding method and an apparatus for performing such a method.
동영상 압축을 위한 표준화 기구인 ISO/IEC의 MPEG과 ITU-T의 VCEG의 연구에 의해서 H.261, H.263, MPEG-1, MPEG-2, MPEG-4, 그리고 H.264와 같은 많은 표준안이 개발되고 이용되고 있다. 이 표준안들은 소수의 생성자가 컨텐츠를 제작 및 유포하고, 유포된 컨텐츠를 다수의 소비자가 소비하는 것을 대상으로 개발되어, 부호기의 복잡도가 복호기의 복잡도 보다 15배 정도가 높게 구성되어 있다. 하지만, 이동식 비디오 장치의 기술이 발전함에 따라, 현재 개인의 컨텐츠 제작이 자유롭게 이루어지면서, 접근이 용의하고 편리한 이동전화 및 노트북 PC를 이용하여 컨텐츠가 제작되고 있는 추세이다.Many standards, such as H.261, H.263, MPEG-1, MPEG-2, MPEG-4, and H.264, have been studied by ISO / IEC MPEG and ITU-T's VCEG, the standardization bodies for video compression. Is being developed and used. These standards were developed for the purpose of producing and distributing contents of a few producers and consuming the distributed contents of many consumers, and the complexity of the encoder is about 15 times higher than the complexity of the decoder. However, as the technology of the mobile video device is developed, the contents are produced by using a mobile phone and a notebook PC which are easily accessible and convenient while the contents production is freely made.
따라서 제한된 연산 처리 능력 및 배터리 성능을 가지는 환경에서의 개인방송을 위해 낮은 복잡도 및 낮은 전원소비가 가능한 분산비디오 부호기/복호기 방법이 제안되고 개발되었다. 분산비디오 방법은 키 프레임과 WZ 프레임을 구분하여 부호화를 수행하는데, 키 프레임은 기존비디오 화면 내 예측 부호화/복호화 방법으로 부호화되고 복원된다. 와이너 지브 프레임은 채널 부호기를 통하여 부호화 되며, 키 프레임을 이용하여 생성된 보조정보를 채널 복호화 함으로써 복원된다. 분산 비디오 코더의 성능은 보조 정보의 성능에 높은 영향을 받으며, 보조 정보의 성능은 프레임마다 다르기 때문에 분산 비디오 부호화기에서 예측하는 것이 쉽지 않다. 일반적으로 안정적인 성능을 위하여, 분산 비디오 코더의 픽쳐 그룹(Group of Pictures, GOP) 구조는 최소의 단위 즉, 픽쳐 그룹 크기를 2로 설정하여 수행한다.Therefore, a distributed video encoder / decoder method capable of low complexity and low power consumption has been proposed and developed for personal broadcasting in an environment having limited computational processing capability and battery performance. The distributed video method performs encoding by dividing a key frame and a WZ frame. The key frame is encoded and reconstructed by a prediction encoding / decoding method in an existing video screen. The Weiner jib frame is encoded through the channel encoder and restored by channel decoding the auxiliary information generated using the key frame. The performance of the distributed video coder is highly affected by the performance of the auxiliary information, and the performance of the auxiliary information varies from frame to frame, making it difficult to predict in a distributed video encoder. In general, for stable performance, a picture group (GOP) structure of a distributed video coder is performed by setting a minimum unit, that is, picture group size to 2.
픽쳐 그룹 구조에서 키 프레임으로 부호화되는 프레임이 와이너 지브 프레임으로 부호화되는 프레임보다 높은 비율을 차지하는 경우 영상 정보를 전송하기 위해 필요한 비트량이 많아지고 분산 비디오 부호화 장치의 복잡도가 높아진다. 반대로 와이너 지브 프레임을 많이 포함하도록 픽쳐 그룹(Group of Pictures, GOP)의 구조를 확장시키게 되면, 와이너 지브 프레임에 오류가 발생할 경우 피드백되는 패러티 비트가 많아짐으로써 지연이 많이 발생하게 되고 분산 비디오 부호화 장치의 성능이 낮아질 수 있다.When the frame encoded by the key frame in the picture group structure occupies a higher ratio than the frame encoded by the wine jib frame, the amount of bits required for transmitting image information increases and the complexity of the distributed video encoding apparatus increases. On the contrary, if the structure of a group of pictures (GOP) is expanded to include a large number of wine jib frames, a lot of delays occur due to a lot of parity bits fed back when an error occurs in the wine jib frame. Performance may be lowered.
따라서, 본 발명의 제1 목적은 적응적으로 픽쳐 그룹의 구조를 변화시키는 분산 비디오 부호화 방법을 제공하는 것이다. Accordingly, a first object of the present invention is to provide a distributed video encoding method for adaptively changing the structure of a picture group.
또한, 본 발명의 제2 목적은 적응적으로 픽쳐 그룹의 구조를 변화시키는 분산 비디오 부호화 방법을 수행하는 장치를 제공하는 것이다.Another object of the present invention is to provide an apparatus for performing a distributed video encoding method for adaptively changing a structure of a picture group.
상술한 본 발명의 제1 목적을 달성하기 위한 본 발명의 일 측면에 따른 분산 비디오 부호화 방법은 부호화 모드를 판단하는 프레임인 모드 결정 프레임의 예측 와이너 지브 프레임 율 왜곡과 예측 키 프레임 율 왜곡을 구하는 단계와 상기 예측 와이너 지브 프레임 율 왜곡과 상기 예측 키 프레임 율 왜곡을 비교하여 상기 모드 결정 프레임을 와이너 지브 프레임 또는 키 프레임 중 적어도 하나의 프레임 모드로 부호화하는 단계를 포함할 수 있다. 상기 분산 비디오 부호화 방법은 상기 모드 결정 프레임을 예측 와이너 지브 프레임 및 예측 키 프레임 중 적어도 하나의 프레임 모드로 생성하는 단계를 더 포함할 수 있다. 상기 예측 와이너 지브 프레임은 분산 비디오 복호화 장치에서 제공된 와이너 지브 프레임 예측 정보에 기초하여 생성될 수 있다. 상기 예측 와이너 지브 프레임 율 왜곡과 상기 예측 키 프레임 율 왜곡을 비교하여 상기 모드 결정 프레임을 와이너 지브 프레임 또는 키 프레임 중 적어도 하나의 프레임 모드로 부호화하는 단계는 상기 모드 결정 프레임을 상기 예측 와이너 지브 프레임과 상기 예측 키 프레임 중 율 왜곡이 작은 프레임 모드로 결정할 수 있다. 상기 모드 결정 프레임은 소정의 픽쳐 그룹 구조에서 프레임의 출력 순서상 첫 번째 프레임인 제1 키 프레임과 마지막 프레임인 제2 키 프레임의 중간 위치 또는 중간에서 하나를 더하거나 뺀 위치에 존재할 수 있다. 상기 분산 비디오 부호화 방법은 상기 모드 결정 프레임이 키 프레임으로 부호화된 경우, 상기 모드 결정 프레임과 상기 제1 키 프레임을 기초로 상기 모드 결정 프레임과 상기 제1 키 프레임의 중간 위치 또는 중간 위치에 하나를 더하거나 뺀 위치에 존재하는 프레임과 상기 모드 결정 프레임과 상기 제2 키 프레임을 기초로 상기 모드 결정 프레임과 상기 제2 키 프레임의 중간 위치 또는 중간 위치에 하나를 더하거나 뺀 위치에 존재하는 프레임을 모드 결정 프레임으로 재설정하는 단계를 더 포함할 수 있다. 상기 예측 키 프레임 율 왜곡은 이미 생성된 예측 키 프레임 율 왜곡 값을 기초로 선형적으로 예측할 수 있다. A distributed video encoding method according to an aspect of the present invention for achieving the first object of the present invention comprises the steps of: obtaining a predicted Weiner jib frame rate distortion and a predicted key frame rate distortion of a mode determination frame, which is a frame for determining an encoding mode. And encoding the mode determination frame into at least one frame mode of a wine zig frame or a key frame by comparing the predicted wine gib frame rate distortion with the predicted key frame rate distortion. The distributed video encoding method may further include generating the mode determination frame in at least one frame mode of a predictive wine jib frame and a predictive key frame. The predicted Weiner Jib frame may be generated based on Weiner Jib frame prediction information provided by a distributed video decoding apparatus. The method may further include encoding the mode determining frame into at least one frame mode of a wine jib frame or a key frame by comparing the predicted Weiner jib frame rate distortion with the predicted key frame rate distortion. A frame mode having a small rate distortion among the predicted key frames may be determined. The mode determination frame may be present at an intermediate position of a first key frame, which is the first frame, and a second key frame, which is the last frame, or at a position added or subtracted from the middle in a predetermined picture group structure. In the distributed video encoding method, when the mode decision frame is encoded as a key frame, one of the mode decision frame and the first key frame is located at an intermediate position or an intermediate position of the mode determination frame and the first key frame. Mode-determining a frame existing at a position added or subtracted and a frame existing at a position added or subtracted from an intermediate position or an intermediate position of the mode determination frame and the second key frame based on the mode determination frame and the second key frame. The method may further include resetting to a frame. The predicted key frame rate distortion may be linearly predicted based on a previously generated predicted key frame rate distortion value.
또한 상술한 본 발명의 제2 목적을 달성하기 위한 본 발명의 일 측면에 따른 분산 비디오 부호화 방법은 부호화 모드를 판단하는 모드 결정 프레임의 예측 와이너 지브 프레임 율 왜곡, 예측 키 프레임 율 왜곡 및 스킵 모드 프레임 율 왜곡을 구하는 단계와 상기 예측 와이너 지브 프레임 율 왜곡, 상기 예측 키 프레임의 율 왜곡 및 스킵 모드 프레임 율 왜곡을 비교하여 상기 모드 결정 프레임을 와이너 지브 프레임, 키 프레임 및 스킵 모드 프레임 중 적어도 하나의 프레임 모드로 부호화하는 단계를 포함할 수 있다. 상기 분산 비디오 부호화 방법은 상기 소정의 프레임을 예측 와이너 지브 프레임, 예측 키 프레임 및 스킵 모드 프레임 중 적어도 하나의 프레임 모드로 생성하는 단계를 더 포함할 수 있다. 상기 예측 와이너 지브 프레임 율 왜곡, 상기 예측 키 프레임의 율 왜곡 및 스킵 모드 프레임 율 왜곡을 비교하여 상기 모드 결정 프레임을 와이너 지브 프레임, 키 프레임 및 스킵 모드 프레임 중 적어도 하나의 프레임 모드로 부호화하는 단계는 상기 모드 결정 프레임을 상기 예측 와이너 지브 프레임, 상기 예측 키 프레임 및 상기 스킵 모드 프레임 중 율 왜곡이 작은 프레임 모드로 결정하는 단계일 수 있다. 상기 모드 결정 프레임은 소정의 픽쳐 그룹 구조에서 프레임의 출력 순서상 첫 번째 프레임인 제1 키 프레임과 마지막 프레임인 제2 키 프레임의 중간 위치 또는 중간에서 하나를 더하거나 뺀 위치에 존재하는 프레임일 수 있다. 상기 분산 비디오 부호화 방법은 상기 모드 결정 프레임이 키 프레임으로 부호화된 경우, 상기 모드 결정 프레임과 상기 제1 키 프레임을 기초로 상기 모드 결정 프레임과 상기 제1 키 프레임의 중간 위치 또는 중간 위치에 하나를 더하거나 뺀 위치에 존재하는 프레임과 상기 모드 결정 프레임과 상기 제2 키 프레임을 기초로 상기 모드 결정 프레임과 상기 제2 키 프레임의 중간 위치 또는 중간 위치에 하나를 더하거나 뺀 위치에 존재하는 프레임을 모드 결정 프레임으로 재설정하는 단계를 더 포함할 수 있다. 상기 예측 키 프레임 율 왜곡은 이미 생성된 예측 키 프레임의 율 왜곡 값을 기초로 선형적으로 예측할 수 있다. In addition, the distributed video encoding method according to an aspect of the present invention for achieving the above-described second object of the present invention includes predicted Weiner jib frame rate distortion, predictive key frame rate distortion, and skip mode frame of a mode determination frame for determining an encoding mode. Obtaining a rate distortion and comparing the predicted Weiner jib frame rate distortion, the rate distortion of the predicted key frame, and the skip mode frame rate distortion, and converting the mode determination frame into at least one frame of a Weiner jib frame, a key frame, and a skip mode frame. The method may include encoding in a mode. The distributed video encoding method may further include generating the predetermined frame in at least one frame mode of a predictive wine jib frame, a predictive key frame, and a skip mode frame. Encoding the mode determination frame into at least one frame mode among a wine zeb frame, a key frame, and a skip mode frame by comparing the predicted Weiner jib frame rate distortion, the rate distortion of the predictive key frame, and the skip mode frame rate distortion. The mode determining frame may be determined as a frame mode having a small rate distortion among the prediction winener jib frame, the prediction key frame, and the skip mode frame. The mode determination frame may be a frame existing in a middle position of a first key frame, which is a first frame, and a second key frame, which is a last frame, or at a position added or subtracted from the middle, in a predetermined picture group structure. . In the distributed video encoding method, when the mode decision frame is encoded as a key frame, one of the mode decision frame and the first key frame is located at an intermediate position or an intermediate position of the mode determination frame and the first key frame. Mode-determining a frame existing at a position added or subtracted and a frame existing at a position added or subtracted from an intermediate position or an intermediate position of the mode determination frame and the second key frame based on the mode determination frame and the second key frame. The method may further include resetting to a frame. The prediction key frame rate distortion may be linearly predicted based on the rate distortion value of the previously generated prediction key frame.
또한 상술한 본 발명의 제3 목적을 달성하기 위한 본 발명의 일 측면에 따른 분산 비디오 부호화 장치는 부호화 모드를 판단하는 프레임인 모드 결정 프레임의 분산 비디오 모드를 결정하여 분산 비디오 부호화가 수행되는 픽쳐 그룹의 구조를 결정하는 픽쳐 그룹 구조 결정부와 상기 픽쳐 그룹 구조 결정부에서 결정된 픽쳐 그룹 구조를 기초로 분산 비디오 부호화를 수행하는 분산 비디오 부호화부를 포함할 수 있다. 상기 픽쳐 그룹 구조 결정부는 상기 모드 결정 프레임의 예측 와이너 지브 프레임을 생성하는 제1 와이너 지브 프레임 생성부, 상기 제1 와이너 지브 프레임 생성부에서 생성된 상기 예측 와이너 지브 프레임 율 왜곡과 상기 분산 비디오 부호화부에서 생성된 상기 소정의 프레임의 예측 키 프레임의 율 왜곡을 비교하는 율 왜곡 측정부와 상기 예측 와이너 지브 프레임 율 왜곡과 상기 예측 키 프레임의 율 왜곡을 비교하여 상기 소정의 프레임의 부호화 모드를 결정하는 모드 결정부를 더 포함할 수 있다. 상기 픽쳐 그룹 구조 결정부는 상기 모드 결정 프레임이 키 프레임으로 부호화된 경우, 상기 모드 결정 프레임과 소정의 픽쳐 그룹 구조에서 프레임의 출력 순서상 첫 번째 프레임인 제1 키 프레임을 기초로 상기 모드 결정 프레임과 상기 제1 키 프레임의 중간 위치 또는 중간 위치에 하나를 더하거나 뺀 위치에 존재하는 프레임과 상기 모드 결정 프레임과 소정의 픽쳐 그룹 구조에서 프레임의 출력 순서상 마지막 프레임인 제2 키 프레임을 기초로 상기 모드 결정 프레임과 상기 제2 키 프레임의 중간 위치 또는 중간 위치에 하나를 더하거나 뺀 위치에 존재하는 프레임을 모드 결정 프레임으로 재설정할 수 있다. 상기 픽쳐 그룹 구조 결정부는 상기 모드 결정 프레임의 예측 와이너 지브 프레임을 생성하는 제1 와이너 지브 프레임 생성부, 상기 모드 결정 프레임의 스킵 모드 프레임을 생성하는 스킵 모드 프레임 생성부, 상기 예측 와이너 지브 프레임, 상기 스킵 모드 프레임 및 상기 분산 비디오 부호화부에서 생성된 상기 모드 결정 프레임의 예측 키 프레임의 율 왜곡을 비교하는 율 왜곡 측정부와 상기 율 왜곡 측정부로부터 측정된 상기 예측 와이너 지브 프레임, 상기 예측 키 프레임 및 스킵 모드 프레임의 율 왜곡을 비교하여 상기 소정의 프레임의 부호화 모드를 결정하는 모드 결정부를 더 포함할 수 있다. In addition, according to an aspect of the present invention, a distributed video encoding apparatus according to an aspect of the present invention determines a distributed video mode of a mode determination frame, which is a frame for determining an encoding mode, to perform distributed video encoding. It may include a picture group structure determiner for determining the structure of and a distributed video encoder for performing distributed video encoding based on the picture group structure determined by the picture group structure determiner. The picture group structure determiner includes: a first winey jib frame generator configured to generate a predicted winery jib frame of the mode determination frame; the predicted winery jib frame rate distortion generated by the first winery jib frame generator; and the distributed video encoder A rate distortion measuring unit comparing the rate distortion of the predictive key frame of the predetermined frame and the predicted wine jib frame rate distortion and the rate distortion of the predicted key frame to determine an encoding mode of the predetermined frame The apparatus may further include a mode determiner. When the mode determination frame is encoded as a key frame, the picture group structure determination unit determines the mode determination frame based on the mode determination frame and the first key frame based on a first key frame in the output order of the frames in the predetermined picture group structure. The mode based on a frame existing at a middle position of the first key frame or a position added or subtracted from one of the intermediate positions and a second key frame which is the last frame in the output order of the frames in the mode determination frame and the predetermined picture group structure; The frame existing at the intermediate position or the intermediate position of the determination frame and the second key frame may be reset to the mode determination frame. The picture group structure determiner comprises: a first winey jib frame generator configured to generate a predicted Weiner jib frame of the mode determination frame; a skip mode frame generator configured to generate a skip mode frame of the mode determined frame; A rate distortion measuring unit for comparing a skip mode frame and a rate distortion of a predictive key frame of the mode determination frame generated by the distributed video encoder, the predictive wier jib frame measured from the rate distortion measuring unit, and the predictive key frame; The apparatus may further include a mode determiner configured to determine the encoding mode of the predetermined frame by comparing the rate distortion of the skip mode frame.
또한 상술한 본 발명의 제4 목적을 달성하기 위한 본 발명의 일 측면에 따른 분산 비디오 복호화 장치는 키 프레임 예측 정보를 제공받고 키 프레임을 복원하는 키 프레임 복호화부와 상기 키 프레임 복호화부에서 복원된 키 프레임을 기초로 소정의 화면 예측 방법을 통해 생성된 와이너 지브 예측 정보를 기초로 와이너 지브 프레임을 생성하는 제2 와이너 지브 프레임 생성부를 포함하고, 상기 제2 와이너 지브 프레임 생성부는 와이너 지브 프레임 예측 정보를 분산 비디오 부호화기로 제공할 수 있다. 상기 분산 비디오 복호화 장치는 상기 분산 비디오 부호화부로부터 부호화 모드를 판단하는 프레임인 모드 결정 프레임의 부호화 정보를 제공받고 상기 모드 결정 프레임이 와이너 지브 프레임으로 결정되는 경우 변환 및 양자화를 수행하는 선처리부를 더 포함할 수 있다.In addition, the distributed video decoding apparatus according to an aspect of the present invention for achieving the above-described fourth object of the present invention is provided with a key frame decoding unit for receiving key frame prediction information and reconstructing a key frame. And a second winery jib frame generation unit configured to generate a winery jib frame based on the winery jib prediction information generated through a predetermined screen prediction method based on a key frame, wherein the second winery jib frame generation unit comprises: May be provided to a distributed video encoder. The distributed video decoding apparatus further includes a preprocessing unit configured to receive encoding information of a mode determination frame, which is a frame for determining an encoding mode, from the distributed video encoder, and to perform transformation and quantization when the mode determination frame is determined to be a wine jib frame. can do.
상술한 바와 같이 본 발명의 실시예에 따른 픽쳐 그룹의 구조를 변화시키는 분산 비디오 부호화/복호화 방법 및 이러한 방법을 수행하는 장치에 따르면, 영상 시퀀스의 성질에 따라 적응적으로 키 프레임과 와이너 지브 프레임으로 구성되는 GOP(Group of Picture)를 변화시켜 분산 비디오 부호화를 수행시 높은 부호화 효율을 가질 수 있다.As described above, according to a distributed video encoding / decoding method for changing the structure of a picture group according to an embodiment of the present invention, and an apparatus for performing such a method, the key frame and the wine jib frame may be adaptively adapted according to the nature of the image sequence. By varying the configured GOP (Group of Picture) it can have a high coding efficiency when performing distributed video coding.
도 1은 본 발명의 일실시예에 따른 분산 비디오 부호화 장치 및 복호화 장치를 나타낸 개념도이다.1 is a conceptual diagram illustrating a distributed video encoding apparatus and a decoding apparatus according to an embodiment of the present invention.
도 2는 본 발명의 일실시예에 따른 GOP 구조를 형성하는 방법을 나타내는 개념도이다.2 is a conceptual diagram illustrating a method of forming a GOP structure according to an embodiment of the present invention.
도 3은 본 발명의 다른 실시예에 따른 분산 비디오 부호화 장치 및 분산 비디오 복호화 장치를 나타낸다. 3 shows a distributed video encoding apparatus and a distributed video decoding apparatus according to another embodiment of the present invention.
도 4는 본 발명의 또 다른 실시예에 따른 프레임의 부호화 모드를 결정하는 방법을 나타낸 순서도이다.4 is a flowchart illustrating a method of determining an encoding mode of a frame according to another embodiment of the present invention.
도 5는 본 발명의 또 다른 실시예에 따른 프레임의 부호화 모드를 결정하는 방법을 나타낸 순서도이다.5 is a flowchart illustrating a method of determining an encoding mode of a frame according to another embodiment of the present invention.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.As the invention allows for various changes and numerous embodiments, particular embodiments will be illustrated in the drawings and described in detail in the written description. However, this is not intended to limit the present invention to specific embodiments, it should be understood to include all modifications, equivalents, and substitutes included in the spirit and scope of the present invention. In describing the drawings, similar reference numerals are used for similar elements.
제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.Terms such as first and second may be used to describe various components, but the components should not be limited by the terms. The terms are used only for the purpose of distinguishing one component from another. For example, without departing from the scope of the present invention, the first component may be referred to as the second component, and similarly, the second component may also be referred to as the first component. The term and / or includes a combination of a plurality of related items or any item of a plurality of related items.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어"있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어"있다거나 "직접 접속되어"있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.When a component is referred to as being "connected" or "connected" to another component, it may be directly connected to or connected to that other component, but it may be understood that other components may exist in the middle. Should be. On the other hand, when a component is referred to as being "directly connected" or "directly connected" to another component, it should be understood that there is no other component in between.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.The terminology used herein is for the purpose of describing particular example embodiments only and is not intended to be limiting of the present invention. Singular expressions include plural expressions unless the context clearly indicates otherwise. In this application, the terms "comprise" or "have" are intended to indicate that there is a feature, number, step, operation, component, part, or combination thereof described in the specification, and one or more other features. It is to be understood that the present invention does not exclude the possibility of the presence or the addition of numbers, steps, operations, components, components, or a combination thereof.
이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예를 보다 상세하게 설명하고자 한다. 이하, 도면상의 동일한 구성요소에 대해서는 동일한 참조부호를 사용하고 동일한 구성요소에 대해서 중복된 설명은 생략한다.Hereinafter, with reference to the accompanying drawings, it will be described in detail a preferred embodiment of the present invention. Hereinafter, the same reference numerals are used for the same components in the drawings, and duplicate descriptions of the same components are omitted.

이하 본 발명의 실시예에서는 키 프레임을 생성하기 위해 소정의 화면 예측 방법을 통해 예측된 상태의 키 프레임을 예측 키 프레임이라고 정의한다. 즉, 예측 키 프레임에 키 프레임과 예측 키 프레임 사이의 차이값인 잔차값을 더하면 키 프레임을 생성할 수 있다. 분산 비디오 복호화기에서는 분산 비디오 부호화기에서 전달된 키 프레임 예측 정보를 기초로 예측 키 프레임을 생성하고 생성된 예측 키 프레임에 잔차값을 더해서 키 프레임을 생성할 수 있다. 또한, 복호화기에서 와이너 지브 프레임을 생성하기 위해 소정의 화면 예측 방법을 통해 예측된 상태의 와이너 지브 프레임을 보조 정보 프레임이라고 정의한다. 부호화기에서 전달된 패리티 정보를 기초로 보조 정보 프레임을 와이너 지브 프레임으로 생성할 수 있다.Hereinafter, in the embodiment of the present invention, a key frame in a state predicted through a predetermined screen prediction method to generate a key frame is defined as a predicted key frame. That is, a key frame may be generated by adding a residual value, which is a difference between the key frame and the predicted key frame, to the predicted key frame. In the distributed video decoder, a predictive key frame may be generated based on the key frame prediction information transmitted from the distributed video encoder, and a key frame may be generated by adding a residual value to the generated predicted key frame. In addition, in order to generate the Weiner Jib frame in the decoder, the Weiner Jib frame of the predicted state is defined as an auxiliary information frame. An auxiliary information frame may be generated as a wine jib frame based on the parity information transmitted from the encoder.
또한, 부호화기에서 소정의 예측 정보를 기초로 예측된 와이너 지브 프레임을 예측 보조 정보 프레임이라고 정의하고, 부호화기에서 예측 보조 정보 프레임을 기초로 생성된 와이너 지브 프레임을 예측 와이너 지브 프레임이라고 한다. In addition, the Weiner jib frame predicted based on the predetermined prediction information in the encoder is defined as a prediction auxiliary information frame, and the Weiner jib frame generated based on the prediction auxiliary information frame in the encoder is called a predicted winener jib frame.
또한, 본 발명의 실시예에서는 설명의 편의상 예측 키 프레임은 화면 내 예측 방법을 사용하고 보조 정보 프레임 및 예측 보조 정보 프레임은 화면 간 예측 방법을 사용하는 것으로 가정하지만, 예측 키 프레임도 화면 간 예측을 사용할 수 있고, 보조 정보 프레임 및 예측 보조 정보 프레임도 화면 내 예측을 사용할 수 있다. 예를 들어, 예측 키 프레임을 생성함에 있어서, 소정의 예측 키 프레임을 이용해 화면 간 예측을 사용하여 예측을 수행할 수 있고 보조 정보 프레임 및 예측 보조 정보 프레임도 화면 간 예측이 불가능할 경우, 화면 내 예측을 통해 보조 정보 프레임 및 예측 보조 정보 프레임을 생성할 수 있다. 본 발명의 실시예에서는 픽쳐와 프레임을 동일한 의미로 사용한다.In addition, in the embodiment of the present invention, for convenience of explanation, it is assumed that the prediction key frame uses the intra prediction method and the auxiliary information frame and the prediction auxiliary information frame use the inter prediction method. In addition, the auxiliary information frame and the prediction auxiliary information frame may use intra prediction. For example, in generating a prediction key frame, when the prediction may be performed by using inter prediction using a predetermined prediction key frame, and the auxiliary information frame and the prediction auxiliary information frame are also impossible to inter prediction, the intra prediction is performed. The auxiliary information frame and the predictive auxiliary information frame can be generated through. In the embodiment of the present invention, the picture and the frame are used in the same meaning.

도 1은 본 발명의 일실시예에 따른 분산 비디오 부호화 장치 및 복호화 장치를 나타낸 개념도이다.1 is a conceptual diagram illustrating a distributed video encoding apparatus and a decoding apparatus according to an embodiment of the present invention.
도 1을 참조하면, 분산 비디오 부호화 장치는 픽쳐 그룹(Group of Pictures, GOP) 구조 결정부(110), 분산 비디오 부호화부(130)를 포함할 수 있다.Referring to FIG. 1, a distributed video encoding apparatus may include a picture group (GOP) structure determiner 110 and a distributed video encoder 130.
이하의 본 발명의 실시예에서는 설명의 편의상 픽쳐 그룹 구조 결정부(110)와 분산 비디오 부호화부(130)를 분리된 구성으로 서술하지만, 픽쳐 그룹 구조 결정부(110)와 분산 비디오 부호화부(130)는 하나의 구성으로 구현될 수 있다.In the following embodiment of the present invention, the picture group structure determiner 110 and the distributed video encoder 130 are described in separate configurations for convenience of description, but the picture group structure determiner 110 and the distributed video encoder 130 are described. ) May be implemented in one configuration.
픽쳐 그룹 구조 결정부(110)에서는 부호화 모드를 판단하는 프레임인 모드 결정 프레임의 분산 비디오 모드를 결정하여 분산 비디오 부호화가 수행되는 픽쳐 그룹의 구조를 결정할 수 있고, 분산 비디오 부호화부(130)에서는 픽쳐 그룹 구조 결정부에서 결정된 픽쳐 그룹 구조를 기초로 분산 비디오 부호화를 수행할 수 있다.The picture group structure determiner 110 may determine a structure of a picture group in which distributed video encoding is performed by determining a distributed video mode of a mode determination frame, which is a frame for determining an encoding mode, and the distributed video encoder 130 may determine a picture. Distributed video encoding may be performed based on the picture group structure determined by the group structure determiner.
픽쳐 그룹 구조 결정부(110)는 예측 보조 정보 프레임 생성부(113), 예측 와이너 지브 프레임 생성부(116), 율 왜곡 측정부(120), 모드 결정부(125)를 포함할 수 있고, 분산 비디오 부호화부(130)는 키 프레임 부호화부(135), 선처리부(140), 채널 부호화부(145)를 포함할 수 있다.The picture group structure determiner 110 may include a prediction auxiliary information frame generator 113, a predictive wine jib frame generator 116, a rate distortion measurer 120, and a mode determiner 125. The video encoder 130 may include a key frame encoder 135, a preprocessor 140, and a channel encoder 145.
픽쳐 그룹 구조 결정부(110)는 하나의 픽쳐 그룹 단위에서 부호화되는 키 프레임과 와이너 지브 프레임의 구조를 결정할 수 있다. 픽쳐 그룹 단위의 기본적인 구조는 2개의 키 프레임과 2개의 키 프레임 사이에 포함되어 있는 와이너 지브 프레임으로 구성될 수 있다.The picture group structure determiner 110 may determine a structure of a key frame and a wine jib frame encoded in one picture group unit. The basic structure of the picture group unit may be composed of two key frames and a wine jib frame included between the two key frames.
픽쳐 그룹에서 키 프레임으로 부호화되는 프레임이 많아질수록 키 프레임을 생성하기 위한 화면 예측이 많이 사용되고 분산비디오 부호화 장치의 복잡도가 커지게 될뿐만 아니라 와이너 지브 프레임이 픽쳐 그룹 내에 많이 포함될 때보다 상대적으로 더 많은 비트량이 필요할 수 있다.As more frames are encoded as key frames in a picture group, more screen prediction for generating key frames is used, and the complexity of the distributed video encoding apparatus is increased, and a relatively larger number of wine jib frames are included in the picture group. Large bits may be required.
반대로 키 프레임으로 부호화 되는 프레임의 비율을 낮추고 와이너 지브 프레임으로 부호화되는 프레임의 비율이 높아지는 경우, 부호화부에서 수행되는 화면 예측이 감소하여 부호화 장치의 복잡도는 감소하지만, 복호화기에서 생성한 와이너 지브 프레임에 에러가 많이 존재하는 경우, 피드백을 위한 채널 용량이 커야하는 단점이 있다.On the contrary, when the ratio of the frame encoded by the key frame is lowered and the ratio of the frame encoded by the Weiner jib frame increases, the picture prediction performed by the encoder decreases, thereby reducing the complexity of the encoding apparatus. In the case where there are many errors, the channel capacity for the feedback must be large.
따라서, 영상 시퀀스의 특성에 따라 분산 비디오 부호화기의 성능을 개선하기 위하여, 픽쳐 그룹 구조 결정부(110)에서는 적응적으로 픽쳐 그룹 구조를 결정할 수 있다. 픽쳐 그룹 구조 결정부(110)에서 소정의 프레임에 대하여 예측 보조 정보 프레임을 기초로 생성된 예측 와이너 지브 프레임을 생성하고 이를 키 프레임의 율 왜곡과 비교하여 율 왜곡에 따라 소정의 프레임을 와이너 지브 프레임으로 부호화할지 키 프레임으로 부호화할지를 선택하여 픽쳐 그룹 구조를 적응적으로 변화시킬 수 있다. 픽쳐 그룹 구조에 와이너 지브 프레임 및 키 프레임 뿐만 아니라 스킵 모드 예측을 사용하는 스킵 모드 프레임을 추가하는 방법을 사용하여 픽쳐 그룹 구조를 변화시킬 수도 있다.Accordingly, in order to improve the performance of the distributed video encoder according to the characteristics of the image sequence, the picture group structure determiner 110 may adaptively determine the picture group structure. The picture group structure determiner 110 generates a predictive wine jib frame generated based on the prediction auxiliary information frame with respect to the predetermined frame, compares it with the rate distortion of the key frame, and selects the predetermined frame according to the rate distortion. It is possible to adaptively change the picture group structure by selecting whether to encode or encode to a key frame. The picture group structure may be changed using a method of adding a skip mode frame using skip mode prediction as well as a wine jib frame and a key frame to the picture group structure.

도 2는 본 발명의 일실시예에 따른 픽쳐 그룹(Group of Pictures, GOP) 구조를 형성하는 방법을 나타내는 개념도이다.2 is a conceptual diagram illustrating a method of forming a group of pictures (GOP) structure according to an embodiment of the present invention.
도 2를 참조하면, 초기 픽쳐 그룹 구조는 제1 프레임부터 제K 프레임까지 K개의 프레임을 가지는 픽쳐 그룹 구조일 수 있다. 이하 본 발명의 실시예에 따른 픽쳐 그룹 구조에서는 설명의 편의상 소정의 픽쳐 그룹 구조에서 출력 순서상 첫 번째 키 프레임을 지시하는 용어를 제1 키 프레임, 마지막 키 프레임을 지시하는 용어를 제2 키 프레임이라고 정의한다. Referring to FIG. 2, the initial picture group structure may be a picture group structure having K frames from the first frame to the K-th frame. In the picture group structure according to an embodiment of the present invention, for convenience of description, a term indicating a first key frame in an output order in a predetermined picture group structure is referred to as a first key frame and a term indicating a last key frame is referred to as a second key frame. It is defined as.
K개의 프레임을 가지는 픽쳐 그룹 구조에서 첫 번째 프레임인 제1 키 프레임(200)과 마지막 프레임인 제2 키 프레임(250)은 키 프레임 모드로 부호화될 수 있다. 픽쳐 그룹 구조 결정부(110)에서는 제1 키 프레임(200)과 제2 키 프레임(250)의 중간에 위치한 프레임인 모드 결정 프레임(230)을 와이너 지브 프레임으로 부호화할지 키 프레임으로 부호화할지 여부를 결정할 수 있다. 이하, 본 발명의 실시예에서는 소정의 픽쳐 그룹 구조에서 첫 번째 키 프레임인 제1 키 프레임(200)과 마지막 키 프레임인 제2 키 프레임(250) 사이에 중간에 존재하는 프레임을 모드 결정 프레임(230)이라는 용어로 사용한다. In the picture group structure having K frames, the first key frame 200 as the first frame and the second key frame 250 as the last frame may be encoded in the key frame mode. The picture group structure determination unit 110 determines whether to encode the mode determination frame 230, which is a frame located between the first key frame 200 and the second key frame 250, as a wine jib frame or a key frame. You can decide. Hereinafter, in the exemplary embodiment of the present invention, a frame existing between the first key frame 200 as the first key frame and the second key frame 250 as the last key frame in the predetermined picture group structure may be selected as a mode determination frame ( 230).
K가 짝수인 경우, K를 2로 나눈 값 또는 K를 2로 나눈 값에 1을 더한 값 혹은 뺀 값을 프레임 출력 순서로 가지는 프레임이 모드 결정 프레임이 될 수 있고, K가 홀수인 경우, K값에 하나를 더한 값을 반으로 나눈 값을 프레임 출력 순서로 가지는 프레임이 모드 결정 프레임이 될 수 있다. 즉, 적응적으로 픽쳐 그룹 구조를 변경하는 본 발명의 본질에 벋어나지 않는 한, 모드 결정 프레임의 위치는 변할 수 있다.If K is even, a frame having K divided by 2 or K divided by 2 plus 1 or subtracted in the order of frame output may be a mode determining frame, and if K is odd, K A frame having a value obtained by adding one value and dividing it in half may be a mode determining frame. That is, the position of the mode determination frame can be changed unless it is contrary to the nature of the present invention to adaptively change the picture group structure.
모드 결정 프레임(230)을 와이너 지브 프레임으로 부호화할지 키 프레임으로 부호화할지 여부를 결정하기 위해 제1 키 프레임(200)과 제2 키 프레임(250)을 기초로 화면 간 예측 방법과 같은 화면 예측 방법을 사용하여 모드 결정 프레임(230)을 예측 와이너 지브 프레임으로 생성할 수 있다. 예측 와이너 지브 프레임으로 생성된 모드 결정 프레임(230)은 모드 결정 프레임(230)이 키 프레임일 경우와 모드 결정 프레임(230)이 예측 와이너 지브 프레임 경우와의 율 왜곡을 비교하여 모드 결정 프레임(230)이 키 프레임으로 부호화될지 아니면 와이너 지브 프레임으로 부호화될지를 결정할 수 있다. 모드 결정 프레임(230)을 예측 와이너 지브 프레임으로 생성하기 위해 분산 비디오 복호화기에서 보조 정보 프레임을 생성하기 위해 사용된 소정의 예측 정보(이하, 예측 보조 정보 프레임 생성 정보라고 함.)를 사용할 수 있다. 모드 결정 프레임(230)을 예측 와이너 지브 프레임으로 생성하기 위해 분산 비디오 복호화기에서 전송된 예측 보조 정보 프레임 생성 정보를 사용하지 않고 분산 비디오 부호화기 자체에서 화면 예측 방법을 통해 예측 보조 정보 프레임을 생성하는 것도 가능하다.A screen prediction method such as an inter prediction method based on the first key frame 200 and the second key frame 250 in order to determine whether to encode the mode determination frame 230 into a Weiner jib frame or a key frame. The mode determination frame 230 may be generated as a predictive wine jib frame using. The mode determination frame 230 generated as the predicted winener jib frame compares the rate distortion between the case in which the mode determination frame 230 is the key frame and the case in which the mode determination frame 230 is the predicted wine jib frame. ) May be encoded as a key frame or as a Weiner jib frame. In order to generate the mode decision frame 230 as a predictive wine jib frame, predetermined prediction information (hereinafter, referred to as prediction auxiliary information frame generation information) used to generate an auxiliary information frame in the distributed video decoder may be used. . In order to generate the mode decision frame 230 as a predictive wine jive frame, the distributed video encoder may generate the prediction auxiliary information frame through the screen prediction method without using the prediction auxiliary information frame generation information transmitted from the distributed video decoder. It is possible.
본 발명의 실시예에 따른 분산 비디오 부호화 방법에 따르면 예측 와이너 지브 프레임으로 생성된 모드 결정 프레임(230)의 율 왜곡과 모드 결정 프레임(230)이 키 프레임일 경우의 율 왜곡을 율 왜곡 측정부(120)를 통해 측정하고 율 왜곡 측정부(120)를 통해 측정된 율 왜곡을 기초로 모드 결정부(125)에서는 모드 결정 프레임(230)을 와이너 지브 프레임으로 부호화할지 아니면 키 프레임으로 부호화할지 여부를 결정할 수 있다. 예를 들어, 상대적으로 더 작은 율 왜곡을 가진 프레임으로 모드 결정 프레임(230)의 부호화 방법을 선택할 수 있다.According to the distributed video encoding method according to an embodiment of the present invention, the rate distortion measurement unit may include the rate distortion of the mode decision frame 230 generated as the predictive wine jib frame and the rate distortion when the mode decision frame 230 is a key frame. The mode determiner 125 encodes the mode decision frame 230 as a wine jib frame or a key frame based on the rate distortion measured by the rate distortion measurement unit 120. You can decide. For example, a method of encoding the mode determination frame 230 may be selected as a frame having a relatively smaller rate distortion.
직접적으로 모드 결정 프레임(230)을 예측 와이너 지브 프레임 또는 키 프레임으로 생성하지 않고도 소정의 추정 방법을 통해 모드 결정 프레임(230)의 부호화 방법을 결정할 수 있다.The encoding method of the mode determination frame 230 may be determined through a predetermined estimation method without directly generating the mode determination frame 230 as a predictive wine jib frame or a key frame.
모드 결정부(120)를 통해서 모드 결정 프레임(230)이 와이너 지브 프레임으로 부호화되는 것으로 결정된 경우, 픽쳐 그룹 구조는 첫 번째 프레임인 제1 키 프레임과 K번째 프레임인 제2 키 프레임이 키 프레임으로 부호화되고 나머지 제1 키 프레임과 제2 키 프레임 사이에 있는 프레임들은 와이너 지브 프레임으로 부호화되는 K개의 프레임을 가진 픽쳐 그룹 구조로 결정될 수 있다. 모드 결정 프레임(230)이 와이너 지브 프레임이 아닌 키 프레임으로 부호화되는 것으로 결정되었다면, 제1 키 프레임 및 모드 결정 프레임과 그 사이에 속한 프레임들을 다시 하나의 픽쳐 그룹 단위로 하고, 모드 결정 프레임 및 제2 키 프레임과 그 사이에 속한 프레임들을 다시 하나의 픽쳐 그룹 단위로 하여 픽쳐 그룹 구조를 변경할 수 있다.When it is determined through the mode determination unit 120 that the mode determination frame 230 is encoded as a wine jib frame, the picture group structure has a first key frame as a first frame and a second key frame as a K th frame as key frames. Frames that are encoded and between the remaining first key frame and the second key frame may be determined as a picture group structure having K frames that are encoded as a wine jib frame. If it is determined that the mode determination frame 230 is encoded as a key frame instead of a wine jib frame, the first key frame and the mode determination frame and the frames belonging therebetween are again made into one picture group unit. The picture group structure can be changed by using two key frames and frames belonging to each other in the unit of one picture group.
즉, 제2 프레임이 키 프레임으로 부호화 하는 것으로 결정된다면 GOP 구조를 변화시켜 첫 번째 프레임을 다시 제1 키 프레임으로 두고 모드 결정 프레임을 제2 키 프레임으로 두고 제1 키 프레임과 제2 키 프레임의 중간 프레임인 새로운 모드 결정 프레임을 와이너 지브 프레임으로 할지 아니면 키 프레임으로 할지 여부를 결정하는 절차를 전술한 바와 동일하게 수행할 수 있고, 마찬가지로 모드 결정 프레임을 다시 제1 프레임으로 두고 제2 키 프레임을 제2 키 프레임으로 두고 제1 키 프레임과 제2 키 프레임의 중간 프레임인 새로운 모드 결정 프레임을 와이너 지브 프레임으로 부호화할지 아니면 키 프레임으로 부호화할지 여부를 결정하는 전술한 절차를 동일하게 수행할 수 있다. 이러한 재귀적인 방식을 사용하여 분산 비디오 부호화를 수행할 영상 시퀀스에 대해 서로 다르게 적응적으로 픽쳐 그룹 구조를 형성할 수 있다.That is, if it is determined that the second frame is encoded as a key frame, the GOP structure is changed to change the first frame to the first key frame, and the mode determination frame to the second key frame. The procedure for deciding whether a new mode decision frame, which is an intermediate frame, is to be a wine jib frame or a key frame, can be performed in the same manner as described above, and similarly, the second key frame is set again as the first frame. The above-described procedure of determining whether to encode a new mode determining frame, which is an intermediate frame between the first key frame and the second key frame, as a wine jib frame or a key frame can be performed in the second key frame. . Using such a recursive method, a picture group structure can be formed adaptively differently with respect to an image sequence to perform distributed video encoding.
본 발명의 또 다른 실시예에 따르면, 픽쳐 그룹 구조 결정부(110)에서는 율 왜곡을 측정시 스킵 모드 프레임의 율 왜곡을 측정하는 것을 추가하여 현재 프레임을 와이너 지브 프레임, 키 프레임 및 스킵 모드 프레임 중 적어도 하나의 프레임으로 선택할 수 있다.According to another embodiment of the present invention, the picture group structure determiner 110 measures the rate distortion of the skip mode frame when measuring the rate distortion to add the current frame to a wine jib frame, a key frame, and a skip mode frame. At least one frame may be selected.
스킵 모드 프레임은 소정의 화면 예측을 수행하여 예측 프레임은 생성하되 원본 영상과 동일하게 복원하기 위한 패리티 비트 정보 또는 잔차값 정보를 생성하지 않는 프레임이거나 따로 예측을 수행하지 않고 이전에 복호화된 또는 이전에 출력된 프레임과 동일한 화소값을 사용하여 출력하는 프레임이 될 수 있다. 스킵 모드 프레임을 사용할 경우, 픽쳐 그룹 구조를 형성시 현재 프레임이 키 프레임이 아닌 스킵 모드 프레임 또는 와이너 지브 프레임으로 결정되면, 픽쳐 그룹 구조를 변화시키지 않고, 1번째 프레임과 K번째 프레임이 키 프레임으로 부호화되고 나머지 1번째 프레임과 K번째 프레임 사이에 있는 프레임들의 율 왜곡을 비교하여 와이너 지브 프레임 또는 스킵 모드 프레임 중 하나로 부호화되도록 하는 K개의 프레임을 가진 GOP 구조로 결정될 수 있다. 또한, GOP 구조를 형성시 제1 프레임과 제K 프레임이 키 프레임으로 부호화되고 제1 프레임과 제K 프레임 사이에 존재하는 모드 결정 프레임이 와이너 지브 프레임 또는 스킵 모드 프레임이 아닌 키 프레임으로 부호화되도록 결정되면, 모드 결정 프레임을 제1 키 프레임 또는 제2 키 프레임으로 사용하는 새로운 픽쳐 그룹 구조를 기초로 새로운 픽쳐 그룹 구조에서 다시 중간에 위치한 모드 결정 프레임을 키 프레임, 와이너 지브 프레임, 스킵 모드 프레임 중 어떠한 프레임으로 부호화할지 결정할 수 있다. The skip mode frame is a frame that performs a predetermined screen prediction to generate a prediction frame but does not generate parity bit information or residual value information for reconstructing the same as the original image, or is previously decoded or previously decoded without performing prediction. The frame may be output using the same pixel value as the output frame. When using a skip mode frame, if the current frame is determined to be a skip mode frame or a wine jib frame instead of a key frame when forming a picture group structure, the first frame and the Kth frame are used as key frames without changing the picture group structure. The GOP structure may be determined as a GOP structure having K frames that are encoded and compared with rate distortion of the frames between the first and the K th frames so as to be encoded as either a wine jib frame or a skip mode frame. In addition, when the GOP structure is formed, the first frame and the K-th frame are encoded as key frames, and the mode determination frame existing between the first frame and the K-th frame is determined to be encoded as a key frame instead of a wine jib frame or skip mode frame. If the mode decision frame is located in the middle of the new picture group structure, the mode decision frame is placed in the middle of the key frame, the wine jib frame, or the skip mode frame. It may be determined whether to encode a frame.

다시 도 1을 참조하면, 픽쳐 그룹 구조 결정부(110)는 픽쳐 그룹 구조 결정 방법을 수행하기 위해 예측 보조 정보 프레임 생성부(113), 예측 와이너 지브 프레임 생성부(116), 율 왜곡 측정부(120), 모드 결정부(125)를 포함할 수 있다. Referring back to FIG. 1, the picture group structure determiner 110 may include a prediction auxiliary information frame generator 113, a prediction wine jib frame generator 116, and a rate distortion measurer to perform a picture group structure determination method. 120, the mode determiner 125 may be included.
예측 보조 정보 프레임 생성부(115)는 분산 비디오 복호화 장치(150)로부터 전송된 예측 보조 정보 프레임 생성 정보를 기초로 예측 보조 정보 프레임을 생성할 수 있다. 분산 비디오 복호화 장치(150)의 보조 정보 프레임 생성부(160)에서는 키 프레임을 기초로 화면 간 예측과 같은 화면 예측 방법을 수행하여 보조 정보 프레임을 생성할 수 있다. 분산 비디오 복호화 장치(150)에서 보조 정보 프레임을 생성하기 위해 사용된 소정의 예측 정보는 분산 비디오 부호화 장치(100)의 예측 보조 정보 프레임 생성부(113)로 전송될 수 있고, 예측 보조 정보 프레임 생성부(113)에서는 분산 비디오 복호화 장치에서 보조 정보 프레임을 생성한 것과 동일한 방법으로 예측 보조 정보 프레임을 생성할 수 있다. 즉, 본 발명의 실시예에 따른 분산 비디오 부/복호화 방법에서는 보조 정보 프레임과 예측 보조 정보 프레임이 동일하게 생성될 수 있다. 예측 보조 정보 프레임 생성부(113)에서는 키 프레임을 기초로 소정의 화면 예측 방법을 통해 예측 보조 정보 프레임을 생성할 수도 있다. 즉, 분산 비디오 복호화 장치(150)의 보조 정보 프레임 생성부(160)에서 전송된 예측 보조 정보 프레임 생성 정보가 없이도 예측 보조 정보 프레임을 생성할 수 있다.The prediction assistance information frame generator 115 may generate the prediction assistance information frame based on the prediction assistance information frame generation information transmitted from the distributed video decoding apparatus 150. The auxiliary information frame generator 160 of the distributed video decoding apparatus 150 may generate an auxiliary information frame by performing a screen prediction method such as inter-screen prediction based on a key frame. The predetermined prediction information used to generate the auxiliary information frame in the distributed video decoding apparatus 150 may be transmitted to the prediction auxiliary information frame generator 113 of the distributed video encoding apparatus 100, and generates the prediction auxiliary information frame. The unit 113 may generate the prediction auxiliary information frame in the same manner as the auxiliary information frame is generated by the distributed video decoding apparatus. That is, in the distributed video encoding / decoding method according to an embodiment of the present invention, an auxiliary information frame and a prediction auxiliary information frame may be generated in the same manner. The prediction assistance information frame generator 113 may generate the prediction assistance information frame based on a key frame through a predetermined screen prediction method. That is, the prediction auxiliary information frame may be generated without the prediction auxiliary information frame generation information transmitted from the auxiliary information frame generator 160 of the distributed video decoding apparatus 150.
율 왜곡 측정부(120)는 모드 변경 프레임에 대해 생성된 예측 와이너 지브 프레임의 율 왜곡과 키 프레임의 율 왜곡을 측정할 수 있다.The rate distortion measurement unit 120 may measure the rate distortion of the predicted wine jib frame and the rate distortion of the key frame generated for the mode change frame.
본 발명의 실시예에 따른 분산 비디오 부호화 장치에서는 예측 와이너 지브 프레임과 키 프레임의 율 왜곡을 비교하기 위해 다양한 방법을 사용할 수 있다. 분산 비디오 부호화 장치에서는 와이너 지브 프레임이 분산 비디오 부호화기에서 양자화를 수행시 0이 되지 않는 영역에 한하여, 모든 오류를 수정할 수 있도록, 패리티 비트를 전송할 수 있다. 양자화를 수행시 0이 되지 않는 영역은 만약 선처리 장치(140)에서 DCT(Discrete Cosine Transform)를 수행할 경우, 변환한 DCT 계수가 0이 되지 않는 영역을 의미할 수 있고, DCT 변환을 수행하지 않는 경우, 픽셀값이 0이 되지 않는 영역을 의미할 수 있다. 따라서, 분산 비디오 복호화기(150)에서 프레임을 복원할 경우, 채널 부호화기(145)로부터 전달되는 패리티 비트를 기초로 복원될 수 있는 프레임은 양자화를 통해 0이 되지 않는 영역에 한하여 원본 영상과 동일하다. 따라서, 양자화 후 0이 되는 영역의 오류를 측정하여 와이너 지브 프레임의 왜곡 값을 예측할 수 있다. 분산 비디오 부호화 장치에서는 보조 정보 프레임이 양자화를 수행하여 0이 되는 영역에 대해서는 예측 보조 정보 프레임으로 복원하고 양자화를 수행 후 0이 아닌 영역에 대해서는 원본 프레임과 동일하게 복원하는 방법을 통해서 분산 비디오 복호화기와 동일한 와이너 지브 프레임을 생성하고 이를 기초로 율 왜곡을 비교할 수 있다.In the distributed video encoding apparatus according to the embodiment of the present invention, various methods may be used to compare the rate distortion of the predicted wine jib frame and the key frame. In the distributed video encoding apparatus, the parity bit may be transmitted so that all errors may be corrected only in a region where the Weiner jib frame does not become zero when quantization is performed in the distributed video encoder. When the quantization is performed, the area that does not become zero may mean an area where the transformed DCT coefficient does not become zero when DCT (Discrete Cosine Transform) is performed in the preprocessing device 140. In this case, it may mean an area in which the pixel value does not become zero. Therefore, when reconstructing the frame in the distributed video decoder 150, a frame that can be reconstructed based on the parity bits transmitted from the channel encoder 145 is the same as the original image only in a region that is not zero through quantization. . Therefore, by measuring the error of the zero region after quantization, it is possible to predict the distortion value of the wine jib frame. In the distributed video encoding apparatus, an auxiliary information frame is quantized to restore a prediction auxiliary information frame for a zero region, and a non-zero region is restored to the same as an original frame after quantization. You can create the same wine jib frame and compare the rate distortions based on it.
키 프레임의 경우, 분산 비디오 부호화 장치의 허용 가능한 복잡도 내에서, 화면 내 예측을 수행하여 예측 키 프레임을 생성할 수 있다. 만약, 분산 비디오 부호화 장치에서 허용되는 복잡도에 따라, 소정의 프레임에 대한 예측 키 프레임을 직접적으로 생성할 수도 있지만, 저 복잡도의 부호화를 하는 경우 키 프레임의 율 왜곡 값을 측정하기 위해 직접적으로 키 프레임을 생성하지 않고 현재 프레임과 시간상의 거리가 가장 가까운 주변의 두 키 프레임을 이용하여 현재 프레임을 키 프레임화 할 경우의 율 왜곡을 추정할 수 있다. 예를 들어, 일반적으로 프레임 간의 비트율과 왜곡은 짧은 구간에서 선형적으로 변화한다고 가정할 수 있으므로 현재 프레임을 키 프레임화 할 경우의 율 왜곡은 비트율과 왜곡값을 주변의 두 키 프레임의 거리에 비례한 가중치 합으로 구할 수 있다. In the case of a key frame, a prediction key frame may be generated by performing intra prediction within an allowable complexity of the distributed video encoding apparatus. According to the complexity allowed in the distributed video encoding apparatus, a predictive key frame for a predetermined frame may be generated directly. However, in the case of encoding with low complexity, the key frame is directly measured to measure the rate distortion value of the key frame. It is possible to estimate the rate distortion when the current frame is key framed by using two key frames that are closest to each other in time with the current frame without generating a. For example, in general, it can be assumed that the bit rate and distortion between frames change linearly in a short period, so the rate distortion when keyframe the current frame is proportional to the distance between the two key frames. It can be found as one weighted sum.
모드 결정부(125)는 율 왜곡 측정부(120)에서 측정된 율 왜곡을 기초로 모드 결정 프레임을 와이너 지브 프레임으로 부호화할지 아니면 키 프레임으로 부호화할지 여부를 결정할 수 있다. The mode determiner 125 may determine whether to encode the mode decision frame into a wine jib frame or a key frame based on the rate distortion measured by the rate distortion measurer 120.

분산 비디오 부호화부(130)는 픽쳐 그룹 구조 결정부(110)에 의해 결정된 픽쳐 그룹 구조를 기초로 소정의 프레임을 키 프레임과 와이너 지브 프레임을 부호화할 수 있다. The distributed video encoder 130 may encode a key frame and a wine jib frame in a predetermined frame based on the picture group structure determined by the picture group structure determiner 110.
키 프레임 부호화부(135)는 픽쳐 그룹 구조에서 키 프레임으로 부호화하기로 결정한 프레임에 대하여 키 프레임 부호화를 수행할 수 있다. 키 프레임 부호화는 기존의 H.264/AVC 또는 HEVC와 같은 비디오 부호화 방법에서 사용되는 화면 내 예측 방법과 같은 예측을 수행하는 모드 또는 PCM 모드 예측을 수행하지 않는 모드와 같은 예측 방법을 사용하여 부호화를 할 수 있다.The key frame encoder 135 may perform key frame encoding on a frame determined to be encoded as a key frame in the picture group structure. Key frame encoding uses a prediction method such as a mode that performs prediction, such as an intra picture prediction method used in a conventional video encoding method such as H.264 / AVC or HEVC, or a mode that does not perform PCM mode prediction. can do.
선 처리부(140)는 와이너 지브 프레임을 변환하고 양자화할 수 있다. 와이너 지브 프레임의 변환 방법으로는 예를 들어, DCT(Discrete Cosine Transform) 또는 DST(Discrete Sine Transform)와 같은 변환 방법이 사용될 수 있고 변환 후 소정의 양자화 파라미터를 기초로 양자화될 수 있다.The line processor 140 may convert and quantize the wine jib frame. As a transforming method of the wine jib frame, for example, a transform method such as a discrete cosine transform (DCT) or a discrete sine transform (DST) may be used, and may be quantized based on a predetermined quantization parameter after the transform.
채널 부호화부(145)에서는 패러티 비트를 생성하기위해 LDPC(Low Density Parity Check) 코딩 또는 터보 코딩(Turbo Coding)과 같은 부호화가 수행되어 와이너 지브 프레임에 대한 패리티 비트를 생성하고 생성된 패리티 비트를 분산 비디오 복호화 장치(150)에 전송할 수 있다. The channel encoder 145 performs encoding such as Low Density Parity Check (LDPC) coding or Turbo coding to generate parity bits to generate parity bits for the wine jib frame and to distribute the generated parity bits. The video decoding apparatus 150 may transmit the same.
분산 비디오 복호화 장치(150)는 키 프레임 복호화부(155), 보조 정보 프레임 생성부(160), 선 처리부(165), 채널 코드 복호화부(170), 영상 복원부(175)가 포함될 수 있다. The distributed video decoding apparatus 150 may include a key frame decoder 155, an auxiliary information frame generator 160, a line processor 165, a channel code decoder 170, and an image reconstructor 175.
키 프레임 복호화부(155)에서는 키 프레임 부호화부(135)에서 부호화된 키 프레임 정보를 기초로 키 프레임을 복호화할 수 있다. 예를 들어, 예측 키 프레임 생성에 사용된 키 프레임 예측 정보(예를 들어, 화면 내 예측 모드 정보)와 예측 키 프레임과 키 프레임 사이의 차이값 정보인 잔차값을 분산 비디오 부호화부(130)로부터 전송받고 이를 기초로 키 프레임을 복원하고 복원된 키 프레임을 출력할 수 있다.The key frame decoder 155 may decode the key frame based on the key frame information encoded by the key frame encoder 135. For example, from the distributed video encoder 130, key frame prediction information (for example, intra prediction mode information) used for generating a predictive key frame and a residual value that is difference information between the predicted key frame and the key frame are obtained from the distributed video encoder 130. The received key frame can be recovered and the restored key frame can be output based on the received key frame.
보조 정보 프레임 생성부(160)는 키 프레임 복호화부에서 생성된 키 프레임값을 기초로 보조 정보 프레임을 생성할 수 있다. 예를 들어, 적어도 하나의 키 프레임을 이용한 화면 간 예측을 수행하여 보조 정보 프레임을 생성할 수 있다. 또한 보조 정보 프레임 생성부(160)에서는 보조 정보 프레임을 생성하는데 사용된 소정의 예측 정보를 분산 비디오 부호화부(130)의 예측 보조 정보 프레임 생성부(113)에 전송함으로써 분산 비디오 부호화 장치에서 분산 비디오 복호화 장치(150)에서와 동일한 와이너 지브 프레임을 생성할 수 있다.The auxiliary information frame generator 160 may generate an auxiliary information frame based on the key frame value generated by the key frame decoder. For example, an auxiliary information frame may be generated by performing inter prediction using at least one key frame. In addition, the auxiliary information frame generator 160 transmits the predetermined prediction information used to generate the auxiliary information frame to the prediction auxiliary information frame generator 113 of the distributed video encoder 130 to distribute the video in the distributed video encoding apparatus. The same winery jib frame may be generated as in the decoding apparatus 150.
보조 정보 프레임 생성부(160)는 분산 비디오 부호화 장치로부터 현재 프레임이 와이너 지브 프레임으로 부호화하는 것으로 결정되었는지에 대한 정보를 전달받을 수 있다.The auxiliary information frame generation unit 160 may receive information about whether the current frame is determined to be encoded as a wine jib frame from the distributed video encoding apparatus.
선처리부(165)는 보조 정보 프레임 생성부(160)에서 생성된 보조 정보 프레임을 기초로 변환 및 양자화를 수행할 수 있다. 선처리부(165)는 보조 정보 프레임 생성부(160)에서 전달된 소정의 정보를 기초로 픽쳐 그룹 구조에서 와이너 지브 프레임으로 결정된 프레임만을 대상으로 선처리를 수행할 수 있다.The preprocessor 165 may perform transformation and quantization based on the auxiliary information frame generated by the auxiliary information frame generator 160. The preprocessing unit 165 may perform preprocessing on only the frame determined as the wine jib frame in the picture group structure based on the predetermined information transmitted from the auxiliary information frame generation unit 160.
채널 복호화부(170)에서는 채널 부호화부(145)에서 전송된 패리티 비트를 기초로 보조 정보 프레임에서 에러가 발생되어 있는지 여부를 판단하고 채널 부호화부(145)에 에러를 보정하기 위한 패리티 비트를 요청할 수 있다. 패러티 비트를 기초로 보조 정보 프레임의 오류를 보정하여 와이너 지브 프레임을 생성할 수 있다.The channel decoder 170 determines whether an error has occurred in the auxiliary information frame based on the parity bit transmitted from the channel encoder 145, and requests the channel encoder 145 for parity bits for correcting the error. Can be. A wine zig frame may be generated by correcting an error of the auxiliary information frame based on the parity bits.
영상 복원부(175)는 와이너 지브 프레임에 대하여 역변환 및 역양자화를 수행하여 복원해 출력할 수 있다. The image reconstructor 175 may reconstruct and output the inverse transform and inverse quantization on the Weiner jib frame.

도 3은 본 발명의 다른 실시예에 따른 분산 비디오 부호화 장치 및 분산 비디오 복호화 장치를 나타낸다. 3 shows a distributed video encoding apparatus and a distributed video decoding apparatus according to another embodiment of the present invention.
분산 비디오 부호화 장치는 픽쳐 그룹 구조 결정부(310)와 분산 비디오 부호화부(330)를 포함할 수 있다.The distributed video encoding apparatus may include a picture group structure determiner 310 and a distributed video encoder 330.
도 3을 참조하면, 픽쳐 그룹 구조 결정부(310)는 도 1에서 전술한 픽쳐 그룹 구조 결정부(310)에서 스킵 모드 프레임을 생성하는 스킵 모드 프레임 생성부(317)를 더 포함할 수 있다. 스킵 모드 프레임은 소정의 화면 예측을 수행하여 예측 키 프레임 또는 보조 정보 프레임은 생성하되 원본 영상과 동일하게 복원하기 위한 패리티 비트 정보 또는 잔차값 정보를 생성하지 않고 예측된 프레임을 바로 출력하는 프레임이거나 따로 예측을 수행하지 않고 이전에 복호화된 또는 이전에 출력된 프레임과 동일한 화소값을 사용하여 출력하는 프레임이 될 수 있다. 이하, 본 발명의 실시예에서는 설명의 편의상 이러한 스킵 모드 프레임 생성 방법을 스킵 예측 방법이라고 한다. Referring to FIG. 3, the picture group structure determiner 310 may further include a skip mode frame generator 317 which generates a skip mode frame in the picture group structure determiner 310 described above with reference to FIG. 1. The skip mode frame is a frame that directly outputs a predicted frame without generating parity bit information or residual value information for generating a predictive key frame or an auxiliary information frame by restoring a predetermined screen prediction and reconstructing the same as the original image. It may be a frame output using the same pixel value as a frame previously decoded or previously output without performing prediction. Hereinafter, in the embodiment of the present invention, such a skip mode frame generation method is called a skip prediction method for convenience of description.
픽쳐 그룹 구조 결정부(310)에서는 도 1에서 전술한 절차와 유사하게 현재 프레임을 스킵 모드 프레임으로 부호화할지 결정하기 위해 첫 번째 프레임부터 K번째 프레임까지 K개의 프레임을 가지는 픽쳐 그룹 구조에서 첫 번째 프레임인 제1 키 프레임과 마지막 프레임인 제2 키 프레임은 키 프레임 모드로 부호화될 수 있다. 픽쳐 그룹 구조 결정부(310)에서는 제1 키 프레임과 제2 키 프레임의 중간 프레임인 모드 결정 프레임을 와이너 지브 프레임으로 부호화할지 키 프레임으로 부호화할지 아니면 스킵 모드 프레임으로 부호화할지 여부를 결정할 수 있다. 모드 결정 프레임을 와이너 지브 프레임으로 부호화할지 키 프레임으로 부호화할지 아니면 스킵 모드 프레임으로 부호화할지 여부를 결정하기 위해 제1 키 프레임과 제2 키 프레임을 기초로 모드 결정 프레임을 예측 와이너 지브 프레임 및 스킵 예측 방법을 사용하는 스킵 모드 프레임으로 생성할 수 있다.In the picture group structure determiner 310, the first frame in the picture group structure having K frames from the first frame to the K-th frame to determine whether to encode the current frame into the skip mode frame similarly to the above-described procedure in FIG. The first key frame and the second key frame as the last frame may be encoded in the key frame mode. The picture group structure determiner 310 may determine whether to encode a mode determination frame, which is an intermediate frame between the first key frame and the second key frame, as a wine jib frame, a key frame, or a skip mode frame. Predict the mode decision frame based on the first key frame and the second key frame to determine whether to encode the mode decision frame into a Weiner jib frame, a key frame, or a skip mode frame. You can create a skip mode frame using the method.
율 왜곡 측정부(320)에서는 생성된 예측 와이너 지브 프레임, 키 프레임, 스킵 모드 프레임을 기초로 각 프레임들의 율 왜곡을 측정한다.The rate distortion measurement unit 320 measures rate distortion of each frame based on the generated predicted wine jib frame, key frame, and skip mode frame.
모드 결정부(325)는 현재 프레임을 와이너 지브 프레임, 키 프레임, 스킵 모드 프레임 중 어떠한 프레임으로 부호화할지 결정할 수 있다. The mode determiner 325 may determine whether to encode a current frame into a wine jib frame, a key frame, or a skip mode frame.
분산 비디오 부호화부(330)는 키 프레임 부호화부(335), 선처리부(340), 채널 부호화부(345)를 포함할 수 있다. 각 구성부의 역할은 도 1에서 전술한 바와 동일하나, 프레임이 스킵 모드 프레임으로 결정된 경우 해당 프레임의 잔차값 정보 또는 패러티 비트 정보를 전송하지 않을 수 있다. The distributed video encoder 330 may include a key frame encoder 335, a preprocessor 340, and a channel encoder 345. The role of each component is the same as described above with reference to FIG. 1, but when the frame is determined as the skip mode frame, the residual value information or the parity bit information of the corresponding frame may not be transmitted.
분산 비디오 복호화 장치(350)는 도 1에서 전술한 바와 동일하게 키 프레임 복호화부(355), 보조 정보 프레임 생성부(360), 선처리부(365), 채널 코드 복호화부(370), 영상 복원부(375)가 포함될 수 있고 각 구성부의 기능은 도 1에서 전술한바와 동일하다. The distributed video decoding apparatus 350 includes a key frame decoder 355, an auxiliary information frame generator 360, a preprocessor 365, a channel code decoder 370, and an image reconstruction unit as described above with reference to FIG. 1. 375 may be included and the function of each component is the same as described above in FIG.
다만, 도 1과 달리, 소정의 프레임이 스킵 모드 프레임으로 결정된 경우, 스킵 모드 프레임이 화면 내 예측을 수행한 예측 키 프레임을 그대로 출력하는 프레임이면 분산 비디오 부호화부(330)의 키 프레임 부호화부(335)에서 생성된 예측 키 프레임을 생성하기 위한 키 프레임 예측 정보(예를 들어 화면 내 예측 모드)만을 전송받아서 분산 비디오 복호화 장치(350)에서 키 프레임 예측 정보를 기초로 예측 키 프레임을 생성하여 출력할 수 있다. 또한, 스킵 예측 프레임이 키 프레임을 기초로 한 화면 간 예측을 수행하여 보조 정보 프레임을 생성하되 패러티 정보를 생성하지 않는 방법으로 생성된 프레임인 경우, 보조 정보 프레임 생성부(360)에서 생성된 예측 와이너 지브 프레임을 바로 출력할 수 있다.Unlike in FIG. 1, when a predetermined frame is determined to be a skip mode frame, if the skip mode frame is a frame that outputs a predictive key frame that performs intra prediction, the key frame encoder of the distributed video encoder 330 ( Receives only key frame prediction information (eg, intra prediction mode) for generating the predicted key frame generated in step 335, and generates and outputs a predictive key frame based on the key frame prediction information in the distributed video decoding apparatus 350. can do. In addition, when the skip prediction frame is a frame generated by performing an inter prediction based on a key frame to generate an auxiliary information frame but not generating parity information, the prediction generated by the auxiliary information frame generator 360 Outputs the Winner Jib Frame directly.
또 다른 방법으로 스킵 모드 프레임이 이전에 예측된 소정의 프레임 정보와 동일한 화소값 정보를 그대로 사용하는 프레임인 경우, 소정의 지시 정보(예를 들어, 어떠한 프레임과 동일한 화소값을 사용할 것인지 지시하는 정보)를 기초로 스킵 모드 프레임을 출력할 수 있다.In another method, when the skip mode frame is a frame that uses the same pixel value information as the previously predicted predetermined frame information, the predetermined indication information (for example, information indicating which frame and the same pixel value are to be used). ), A skip mode frame may be output.

도 4는 본 발명의 또 다른 실시예에 따른 프레임의 부호화 모드를 결정하는 방법을 나타낸 순서도이다.4 is a flowchart illustrating a method of determining an encoding mode of a frame according to another embodiment of the present invention.
도 4를 참조하면, 소정의 프레임을 예측 와이너 지브 프레임 또는 키프레임으로 생성한다(단계 S400).Referring to FIG. 4, a predetermined frame is generated as a predictive wine jib frame or a key frame (step S400).
소정의 픽쳐 그룹 구조에서 특정 프레임(예를 들어, 모드 결정 프레임)을 와이너 지브 프레임으로 부호화할지 아니면 키 프레임으로 부호화할지 여부를 결정하기 위해 소정의 프레임을 예측 와이너 지브 프레임과 키 프레임으로 생성할 수 있다.In order to determine whether to encode a specific frame (e.g., a mode determination frame) into a wine jib frame or a key frame in a predetermined picture group structure, a predetermined frame may be generated as a predictive wine jib frame and a key frame. have.
예측 와이너 지브 프레임 또는 키 프레임을 생성하지 않고 율-왜곡을 예측하여 구할 수 있는 경우, 단계 S400은 수행되지 않거나, 예측 와이너 지브 프레임 및 키 프레임 중 하나의 프레임만 생성될 수 있다.If the rate-distortion can be predicted and obtained without generating the predicted wine jib frame or the key frame, step S400 may not be performed or only one frame of the predicted wine jib frame and the key frame may be generated.
예측 와이너 지브 프레임과 키 프레임의 율 왜곡을 구한다.(단계 S410).Rate distortion of the predictive wine jib frame and the key frame is obtained (step S410).
생성된 예측 와이너 지브 프레임과 키 프레임의 율 왜곡을 구하기 위해 전술한 바와 같이 직접 율 왜곡을 산출할 수 있고 특정한 율 왜곡 예측 방법을 사용해 직접 키 프레임 또는 와이너 지브 프레임을 생성하지 않고도 율 왜곡을 산출할 수 있다.In order to calculate the rate distortion of the generated predicted Weiner jib frame and the key frame, the direct rate distortion can be calculated as described above, and the rate distortion can be calculated without generating the direct key frame or the Weiner jib frame using a specific rate distortion prediction method. Can be.
산출된 키 프레임의 율 왜곡과 예측 와이너 지브 프레임의 율 왜곡을 비교한다(단계 S420).The rate distortion of the calculated key frame and the rate distortion of the predicted wine jib frame are compared (step S420).
율 왜곡이 작은 부호화 모드로 현재 프레임을 부호화한다(단계 S430).The current frame is encoded in an encoding mode with a small rate distortion (step S430).
단계 S420 및 단계 S430을 통해 예측 와이너 지브 프레임과 키 프레임의 율 왜곡을 비교하여 상대적으로 율 왜곡이 더 작은 프레임으로 현재 프레임을 결정하여 부호화할 수 있다.In operation S420 and S430, rate distortion between the predicted wine jib frame and the key frame may be compared to determine and encode the current frame into a frame having a smaller rate distortion.
도 2에서 전술한 바와 같이 현재 프레임이 키 프레임으로 부호화하도록 결정되는 경우, 생성된 키 프레임을 기초로 결정된 새로운 픽쳐 그룹 구조에서 다시 한번 도 4의 절차를 수행하여 픽쳐 구조를 결정할 수 있다. As described above with reference to FIG. 2, when the current frame is determined to be encoded as a key frame, the picture structure may be determined by performing the procedure of FIG. 4 again in the new picture group structure determined based on the generated key frame.

도 5는 본 발명의 또 다른 실시예에 따른 프레임의 부호화 모드를 결정하는 방법을 나타낸 순서도이다.5 is a flowchart illustrating a method of determining an encoding mode of a frame according to another embodiment of the present invention.
도 5를 참조하면, 소정의 프레임을 예측 와이너 지브 프레임, 키 프레임, 스킵 모드 프레임으로 생성한다(단계 S500). Referring to FIG. 5, a predetermined frame is generated as a predictive wine jib frame, a key frame, and a skip mode frame (step S500).
소정의 픽쳐 그룹 구조에서 특정 프레임을 예측 와이너 지브 프레임, 키 프레임 또는 스킵 모드 프레임 중 어떠한 프레임 모드로 부호화할지 여부를 결정하기 위해 소정의 프레임을 예측 와이너 지브 프레임, 키 프레임 또는 스킵 모드 프레임으로 생성할 수 있다. 예측 와이너 지브 프레임, 키 프레임 및 스킵 모드 프레임 중 적어도 하나를 생성하지 않고 율 왜곡을 예측하여 구할 수 있는 경우, 단계 S500에서 일부의 프레임을 생성하기 위한 동작은 수행되지 않을 수 있다.To determine whether to encode a specific frame in a predetermined picture group structure as a predictive wine jib frame, a key frame, or a skip mode frame, a predetermined frame is generated as a predictive wine jib frame, a key frame, or a skip mode frame. Can be. When the rate distortion may be predicted and obtained without generating at least one of the predicted wine jib frame, the key frame, and the skip mode frame, an operation for generating some frames may not be performed in step S500.
생성된 예측 와이너 지브 프레임, 키 프레임 및 스킵 모드 프레임의 율 왜곡을 구한다.(단계 S510).Rate distortion of the generated predictive wine jib frame, key frame and skip mode frame is obtained (step S510).
생성된 예측 와이너 지브 프레임, 키 프레임 및 스킵 모드 프레임의 율 왜곡을 구하기 위해 전술한 바와 같이 직접 프레임을 생성하여 율 왜곡을 산출할 수 있고 특정한 율 왜곡 예측 방법을 통해 직접 키 프레임 또는 예측 와이너 지브 프레임을 생성하지 않고도 율 왜곡을 산출할 수 있다.To obtain the rate distortion of the generated predictive wine jib frame, key frame, and skip mode frame, the rate distortion can be calculated by generating a direct frame as described above, and the direct key frame or predictive wine jib frame can be calculated using a specific rate distortion prediction method. Rate distortion can be calculated without generating.
산출된 키 프레임의 율 왜곡률, 예측 와이너 지브 프레임의 율 왜곡률 및 스킵 모드 프레임의 율 왜곡률을 비교한다(단계 S520).The calculated rate distortion rate of the key frame, the rate distortion rate of the predicted wine jib frame, and the rate distortion rate of the skip mode frame are compared (step S520).
율 왜곡이 작은 부호화 모드로 현재 프레임을 부호화한다(단계 S530).The current frame is encoded in an encoding mode with a small rate distortion (step S530).
예측 와이너 지브 프레임의 율 왜곡률이 가장 작은 경우, 현재 프레임을 와이너 지브 프레임으로 부호화하고 키 프레임의 율 왜곡이 가장 작은 경우 현재 프레임을 키 프레임으로 부호화하고 스킵 모드 프레임의 율 왜곡이 가장 작은 경우 현재 프레임을 스킵 모드 프레임으로 부호화한다.If the rate distortion rate of the predictive wine jib frame is the smallest, encode the current frame as a wine jib frame, and if the rate distortion of the key frame is the smallest, encode the current frame as the key frame, and if the rate distortion of the skip mode frame is the smallest, then Is encoded in a skip mode frame.
단계 S520 내지 단계 S530을 통해 예측 와이너 지브 프레임, 예측 키 프레임 및 스킵 모드 프레임의 율 왜곡률을 비교하여 상대적으로 율 왜곡이 작은 프레임으로 현재 프레임을 결정하여 생성할 수 있다. In operation S520 to operation S530, the rate distortion rates of the predictive wine jib frame, the predictive key frame, and the skip mode frame may be compared to determine and generate the current frame as a frame having a relatively low rate distortion.
도 2에서 전술한 바와 같이 현재 프레임이 키 프레임으로 결정되는 경우, 생성된 키 프레임을 기초로 다시 한번 도 4의 절차를 수행하여 픽쳐 그룹 구조를 결정할 수 있다. As described above with reference to FIG. 2, when the current frame is determined to be a key frame, the picture group structure may be determined by performing the procedure of FIG. 4 again based on the generated key frame.

이상 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.Although described with reference to the embodiments above, those skilled in the art will understand that the present invention can be variously modified and changed without departing from the spirit and scope of the invention as set forth in the claims below. Could be.

Claims (19)

  1. 부호화 모드를 판단하는 프레임인 모드 결정 프레임의 예측 와이너 지브 프레임 율 왜곡과 키 프레임 율 왜곡을 구하는 단계; 및
    상기 예측 와이너 지브 프레임 율 왜곡과 상기 키 프레임 율 왜곡을 비교하여 상기 모드 결정 프레임을 와이너 지브 프레임 또는 키 프레임 중 적어도 하나의 프레임 모드로 부호화하는 단계를 포함하는 분산 비디오 부호화 방법.
    Obtaining predicted Weiner jib frame rate distortion and key frame rate distortion of a mode determination frame that is a frame for determining an encoding mode; And
    And encoding the mode determination frame in at least one frame mode of a Weiner jib frame or a key frame by comparing the predicted Weiner jib frame rate distortion and the key frame rate distortion.
  2. 제1항에 있어서, 상기 분산 비디오 부호화 방법은,
    상기 모드 결정 프레임을 예측 와이너 지브 프레임 및 키 프레임 중 적어도 하나의 프레임 모드로 생성하는 단계를 더 포함하는 분산 비디오 부호화 방법.
    The method of claim 1, wherein the distributed video encoding method comprises:
    And generating the mode determination frame in at least one frame mode of a predictive Weiner jib frame and a key frame.
  3. 제2항에 있어서, 상기 예측 와이너 지브 프레임은,
    분산 비디오 복호화기에서 제공된 예측 보조 정보 프레임 생성 정보에 기초하여 생성되는 분산 비디오 부호화 방법.
    The method of claim 2, wherein the predicted wine jib frame,
    A distributed video encoding method generated based on prediction auxiliary information frame generation information provided by a distributed video decoder.
  4. 제1항에 있어서, 상기 예측 와이너 지브 프레임 율 왜곡과 상기 키 프레임 율 왜곡을 비교하여 상기 모드 결정 프레임을 와이너 지브 프레임 또는 키 프레임 중 적어도 하나의 프레임 모드로 부호화하는 단계는,
    상기 모드 결정 프레임을 상기 예측 와이너 지브 프레임과 상기 키 프레임 중 율 왜곡이 작은 프레임 모드로 결정하는 단계인 분산 비디오 부호화 방법.
    The method of claim 1, wherein the encoding of the mode determination frame to at least one frame mode of a wine jib frame or a key frame by comparing the predicted Weiner jib frame rate distortion and the key frame rate distortion comprises:
    And determining the mode determination frame as a frame mode having a small rate distortion among the predicted Weiner jib frame and the key frame.
  5. 제1항에 있어서, 상기 모드 결정 프레임은,
    소정의 픽쳐 그룹 구조에서 프레임의 출력 순서상 첫 번째 프레임인 제1 키 프레임과 마지막 프레임인 제2 키 프레임의 중간 위치 또는 중간에서 하나를 더하거나 뺀 위치에 존재하는 프레임인 분산 비디오 부호화 방법.
    The method of claim 1, wherein the mode determination frame,
    A distributed video encoding method according to a predetermined picture group structure, wherein the frame exists at an intermediate position of a first key frame, which is a first frame, and a second key frame, which is a last frame, or at a position of adding or subtracting one from the middle.
  6. 제5항에 있어서, 상기 분산 비디오 부호화 방법은,
    상기 모드 결정 프레임이 키 프레임으로 부호화된 경우, 상기 모드 결정 프레임과 상기 제1 키 프레임을 기초로 상기 모드 결정 프레임과 상기 제1 키 프레임의 중간 위치 또는 중간 위치에 하나를 더하거나 뺀 위치에 존재하는 프레임과 상기 모드 결정 프레임과 상기 제2 키 프레임을 기초로 상기 모드 결정 프레임과 상기 제2 키 프레임의 중간 위치 또는 중간 위치에 하나를 더하거나 뺀 위치에 존재하는 프레임을 모드 결정 프레임으로 재설정하는 단계를 더 포함하는 분산 비디오 부호화 방법.
    The method of claim 5, wherein the distributed video encoding method is
    When the mode determination frame is encoded as a key frame, the mode determination frame is present at a position added to or subtracted from an intermediate position or an intermediate position of the mode determination frame and the first key frame based on the mode determination frame and the first key frame. Resetting a frame existing at a position added or subtracted to an intermediate position or an intermediate position of the mode determination frame and the second key frame to a mode determination frame based on the frame, the mode determination frame, and the second key frame. Distributed video encoding method further comprising.
  7. 제1항에 있어서, 상기 키 프레임 율 왜곡은,
    이미 생성된 키 프레임 율 왜곡 값을 기초로 선형적으로 예측되는 분산 비디오 부호화 방법.
    The method of claim 1, wherein the key frame rate distortion is,
    A distributed video encoding method which is linearly predicted based on already generated key frame rate distortion values.
  8. 부호화 모드를 판단하는 모드 결정 프레임의 예측 와이너 지브 프레임 율 왜곡, 키 프레임 율 왜곡 및 스킵 모드 프레임 율 왜곡을 구하는 단계; 및
    상기 예측 와이너 지브 프레임 율 왜곡, 상기 키 프레임의 율 왜곡 및 스킵 모드 프레임 율 왜곡을 비교하여 상기 모드 결정 프레임을 와이너 지브 프레임, 키 프레임 및 스킵 모드 프레임 중 적어도 하나의 프레임 모드로 부호화하는 단계를 포함하는 분산 비디오 부호화 방법.
    Obtaining predicted Weiner jib frame rate distortion, key frame rate distortion, and skip mode frame rate distortion of the mode determination frame that determines the encoding mode; And
    Encoding the mode determination frame into at least one frame mode of a wine zig frame, a key frame, and a skip mode frame by comparing the predicted wine jib frame rate distortion, the rate distortion of the key frame, and the skip mode frame rate distortion. Distributed video encoding method.
  9. 제8항에 있어서, 상기 분산 비디오 부호화 방법은,
    상기 모드 결정 프레임을 예측 와이너 지브 프레임, 키 프레임 및 스킵 모드 프레임 중 적어도 하나의 프레임 모드로 생성하는 단계를 더 포함하는 분산 비디오 부호화 방법.
    The method of claim 8, wherein the distributed video encoding method comprises:
    And generating the mode determination frame in at least one frame mode of a predictive Weiner jib frame, a key frame, and a skip mode frame.
  10. 제8항에 있어서, 상기 예측 와이너 지브 프레임 율 왜곡, 상기 키 프레임의 율 왜곡 및 스킵 모드 프레임 율 왜곡을 비교하여 상기 모드 결정 프레임을 와이너 지브 프레임, 키 프레임 및 스킵 모드 프레임 중 적어도 하나의 프레임 모드로 부호화하는 단계는,
    상기 모드 결정 프레임을 상기 예측 와이너 지브 프레임, 상기 키 프레임 및 상기 스킵 모드 프레임 중 율 왜곡이 작은 프레임 모드로 결정하는 단계인 분산 비디오 부호화 방법.
    9. The method of claim 8, wherein the mode determination frame is compared with at least one frame mode of the winery jib frame, key frame, and skip mode frame by comparing the predicted Weiner jib frame rate distortion, the rate distortion of the key frame, and the skip mode frame rate distortion. Encoding by
    And determining the mode determination frame as a frame mode having a small rate distortion among the predicted Weiner jib frame, the key frame, and the skip mode frame.
  11. 제8항에 있어서, 상기 모드 결정 프레임은,
    소정의 픽쳐 그룹 구조에서 프레임의 출력 순서상 첫 번째 프레임인 제1 키 프레임과 마지막 프레임인 제2 키 프레임의 중간 위치 또는 중간에서 하나를 더하거나 뺀 위치에 존재하는 프레임인 분산 비디오 부호화 방법.
    The method of claim 8, wherein the mode determination frame,
    A distributed video encoding method according to a predetermined picture group structure, wherein the frame exists at an intermediate position of a first key frame, which is a first frame, and a second key frame, which is a last frame, or at a position of adding or subtracting one from the middle.
  12. 제11항에 있어서, 상기 분산 비디오 부호화 방법은,
    상기 모드 결정 프레임이 키 프레임으로 부호화된 경우, 상기 모드 결정 프레임과 상기 제1 키 프레임을 기초로 상기 모드 결정 프레임과 상기 제1 키 프레임의 중간 위치 또는 중간 위치에 하나를 더하거나 뺀 위치에 존재하는 프레임과 상기 모드 결정 프레임과 상기 제2 키 프레임을 기초로 상기 모드 결정 프레임과 상기 제2 키 프레임의 중간 위치 또는 중간 위치에 하나를 더하거나 뺀 위치에 존재하는 프레임을 모드 결정 프레임으로 재설정하는 단계를 더 포함하는 분산 비디오 부호화 방법.
    The method of claim 11, wherein the distributed video encoding method comprises:
    When the mode determination frame is encoded as a key frame, the mode determination frame is present at a position added to or subtracted from an intermediate position or an intermediate position of the mode determination frame and the first key frame based on the mode determination frame and the first key frame. Resetting a frame existing at a position added or subtracted to an intermediate position or an intermediate position of the mode determination frame and the second key frame to a mode determination frame based on the frame, the mode determination frame, and the second key frame. Distributed video encoding method further comprising.
  13. 제8항에 있어서, 상기 키 프레임 율 왜곡은,
    이미 생성된 키 프레임의 율 왜곡 값을 기초로 선형적으로 예측되는 분산 비디오 부호화 방법.
    The method of claim 8, wherein the key frame rate distortion is,
    A distributed video encoding method which is linearly predicted based on a rate distortion value of an already generated key frame.
  14. 부호화 모드를 판단하는 프레임인 모드 결정 프레임의 분산 비디오 모드를 결정하여 분산 비디오 부호화가 수행되는 픽쳐 그룹의 구조를 결정하는 픽쳐 그룹 구조 결정부; 및
    상기 픽쳐 그룹 구조 결정부에서 결정된 픽쳐 그룹 구조를 기초로 분산 비디오 부호화를 수행하는 분산 비디오 부호화부를 포함하는 분산 비디오 부호화 장치.
    A picture group structure determiner configured to determine a structure of a picture group in which distributed video encoding is performed by determining a distributed video mode of a mode determination frame that is a frame determining an encoding mode; And
    And a distributed video encoder configured to perform distributed video encoding based on the picture group structure determined by the picture group structure determiner.
  15. 제14항에 있어서, 상기 픽쳐 그룹 구조 결정부는,
    상기 모드 결정 프레임의 예측 보조 정보 프레임을 생성하는 예측 보조 정보 프레임 생성부;
    상기 예측 보조 정보 프레임 생성부에서 생성된 예측 보조 정보 프레임을 기초로 상기 모드 결정 프레임의 예측 와이너 지브 프레임을 생성하는 제1 와이너 지브 프레임 생성부;
    상기 제1 와이너 지브 프레임 생성부에서 생성된 상기 예측 와이너 지브 프레임 율 왜곡과 상기 분산 비디오 부호화부에서 생성된 상기 모드 결정 프레임의 키 프레임의 율 왜곡을 비교하는 율 왜곡 측정부; 및
    상기 예측 와이너 지브 프레임 율 왜곡과 상기 키 프레임의 율 왜곡을 비교하여 상기 모드 결정 프레임의 부호화 모드를 결정하는 모드 결정부를 더 포함하는 분산 비디오 부호화 장치.
    The method of claim 14, wherein the picture group structure determiner,
    A prediction auxiliary information frame generation unit generating a prediction auxiliary information frame of the mode determination frame;
    A first Weiner jib frame generator configured to generate a predicted Weiner jib frame of the mode determination frame based on the prediction assistance information frame generated by the prediction assistance information frame generator;
    A rate distortion measurement unit for comparing the predicted winner jib frame rate distortion generated by the first winey jib frame generator with a rate distortion of a key frame of the mode determination frame generated by the distributed video encoder; And
    And a mode determiner configured to determine an encoding mode of the mode determination frame by comparing the predicted wine jib frame rate distortion with the rate distortion of the key frame.
  16. 제14항에 있어서, 상기 픽쳐 그룹 구조 결정부는,
    상기 모드 결정 프레임이 키 프레임으로 부호화된 경우, 상기 모드 결정 프레임과 소정의 픽쳐 그룹 구조에서 프레임의 출력 순서상 첫 번째 프레임인 제1 키 프레임을 기초로 상기 모드 결정 프레임과 상기 제1 키 프레임의 중간 위치 또는 중간 위치에 하나를 더하거나 뺀 위치에 존재하는 프레임과 상기 모드 결정 프레임과 소정의 픽쳐 그룹 구조에서 프레임의 출력 순서상 마지막 프레임인 제2 키 프레임을 기초로 상기 모드 결정 프레임과 상기 제2 키 프레임의 중간 위치 또는 중간 위치에 하나를 더하거나 뺀 위치에 존재하는 프레임을 모드 결정 프레임으로 재설정하는 분산 비디오 부호화 장치.
    The method of claim 14, wherein the picture group structure determiner,
    When the mode determination frame is encoded as a key frame, the mode determination frame and the first key frame are based on a first key frame which is the first frame in the output order of the frames in the mode determination frame and the predetermined picture group structure. The mode determining frame and the second frame based on a frame existing at a middle position or a position added or subtracted from one of the intermediate positions, and a second key frame which is the last frame in the output order of the frames in the mode determination frame and the predetermined picture group structure. A distributed video encoding apparatus for resetting a frame existing at a middle position of a key frame or a position added or subtracted to one to a mode determination frame.
  17. 제14항에 있어서, 상기 픽쳐 그룹 구조 결정부는,
    상기 모드 결정 프레임의 예측 보조 정보 프레임을 생성하는 예측 보조 정보 프레임 생성부;
    상기 예측 보조 정보 프레임 생성부에서 생성된 예측 보조 정보 프레임을 기초로 상기 모드 결정 프레임의 예측 와이너 지브 프레임을 생성하는 제1 와이너 지브 프레임 생성부;
    상기 모드 결정 프레임의 스킵 모드 프레임을 생성하는 스킵 모드 프레임 생성부;
    상기 예측 와이너 지브 프레임, 상기 스킵 모드 프레임 및 상기 분산 비디오 부호화부에서 생성된 상기 모드 결정 프레임의 키 프레임의 율 왜곡을 비교하는 율 왜곡 측정부; 및
    상기 율 왜곡 측정부로부터 측정된 상기 예측 와이너 지브 프레임, 예측 키 프레임 및 스킵 모드 프레임의 율 왜곡을 비교하여 상기 모드 결정 프레임의 부호화 모드를 결정하는 모드 결정부를 더 포함하는 분산 비디오 부호화 장치.
    The method of claim 14, wherein the picture group structure determiner,
    A prediction auxiliary information frame generation unit generating a prediction auxiliary information frame of the mode determination frame;
    A first Weiner jib frame generator configured to generate a predicted Weiner jib frame of the mode determination frame based on the prediction assistance information frame generated by the prediction assistance information frame generator;
    A skip mode frame generation unit generating a skip mode frame of the mode determination frame;
    A rate distortion measuring unit comparing the rate distortion of the key frame of the mode determining frame generated by the prediction wine zig frame, the skip mode frame, and the distributed video encoder; And
    And a mode determiner configured to determine the encoding mode of the mode decision frame by comparing the rate distortions of the predicted wine jib frame, the predicted key frame, and the skip mode frame measured by the rate distortion measurer.
  18. 키 프레임 예측 정보를 제공받고 키 프레임을 복원하는 키 프레임 복호화부; 및
    상기 키 프레임 복호화부에서 복원된 키 프레임을 기초로 소정의 화면 예측 방법을 통해 생성된 보조 정보 프레임 생성 정보를 기초로 보조 정보 프레임을 생성하고 상기 보조 정보 프레임 생성 정보를 분산 비디오 부호화기로 제공하는 보조 정보 프레임 생성부를 포함하는 분산 비디오 복호화 장치.
    A key frame decoder which receives the key frame prediction information and restores the key frame; And
    An auxiliary frame configured to generate an auxiliary information frame based on auxiliary information frame generation information generated through a predetermined screen prediction method based on the key frame reconstructed by the key frame decoder, and provide the auxiliary information frame generation information to a distributed video encoder. Distributed video decoding apparatus comprising an information frame generator.
  19. 제18항에 있어서, 상기 분산 비디오 복호화 장치는,
    상기 분산 비디오 부호화부로부터 모드 결정 프레임을 와이너 지브 프레임으로 부호화 하는지에 대한 정보를 제공받고 상기 모드 결정 프레임이 와이너 지브 프레임으로 결정되면 와이너 지브 프레임으로 결정된 상기 모드 결정 프레임에 변환 및 양자화를 수행하는 선처리부를 더 포함하는 분산 비디오 복호화 장치.
    The apparatus of claim 18, wherein the distributed video decoding apparatus is
    Preprocessing is performed by the distributed video encoder to receive information on whether to encode a mode decision frame into a wine jib frame, and when the mode determination frame is determined to be a wine jib frame, converting and quantizing the mode decision frame determined as a wine jib frame. Distributed video decoding apparatus further comprising a unit.
PCT/KR2012/001502 2011-10-21 2012-02-28 Distributed video encoding/decoding methods for changing a picture group structure, and apparatus for performing same WO2013058445A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020110108246A KR101311410B1 (en) 2011-10-21 2011-10-21 Methods of distributed video coding modifying group of pictures and apparatuses performing the same
KR10-2011-0108246 2011-10-21

Publications (1)

Publication Number Publication Date
WO2013058445A1 true WO2013058445A1 (en) 2013-04-25

Family

ID=48141070

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2012/001502 WO2013058445A1 (en) 2011-10-21 2012-02-28 Distributed video encoding/decoding methods for changing a picture group structure, and apparatus for performing same

Country Status (2)

Country Link
KR (1) KR101311410B1 (en)
WO (1) WO2013058445A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105900436A (en) * 2014-01-17 2016-08-24 索尼公司 Communication apparatus, communication data generation method, and communication data processing method

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080031344A1 (en) * 2006-08-04 2008-02-07 Microsoft Corporation Wyner-Ziv and Wavelet Video Coding
US20080219346A1 (en) * 2006-07-19 2008-09-11 Dake He Method for efficient encoding and decoding quantized sequence in wyner-ziv coding of video
US20080267288A1 (en) * 2004-06-01 2008-10-30 Qualcomm Incorporated Method, apparatus, and system for enhancing robustness of predictive video codecs using a side-channel based on distributed source coding techniques
US20100208797A1 (en) * 2009-02-17 2010-08-19 Electronics And Telecommunications Research Institute Distributed video encoder and decoder, and distributed video encoding and decoding method

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101511230B1 (en) * 2008-09-26 2015-04-13 성균관대학교산학협력단 Apparatus and Method for Distributed Video Encoding and Decoding Using Adaptive Quantization
KR101221874B1 (en) * 2008-12-03 2013-01-15 한국전자통신연구원 Image processing device

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080267288A1 (en) * 2004-06-01 2008-10-30 Qualcomm Incorporated Method, apparatus, and system for enhancing robustness of predictive video codecs using a side-channel based on distributed source coding techniques
US20080219346A1 (en) * 2006-07-19 2008-09-11 Dake He Method for efficient encoding and decoding quantized sequence in wyner-ziv coding of video
US20080031344A1 (en) * 2006-08-04 2008-02-07 Microsoft Corporation Wyner-Ziv and Wavelet Video Coding
US20100208797A1 (en) * 2009-02-17 2010-08-19 Electronics And Telecommunications Research Institute Distributed video encoder and decoder, and distributed video encoding and decoding method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105900436A (en) * 2014-01-17 2016-08-24 索尼公司 Communication apparatus, communication data generation method, and communication data processing method

Also Published As

Publication number Publication date
KR101311410B1 (en) 2013-09-25
KR20130044011A (en) 2013-05-02

Similar Documents

Publication Publication Date Title
US8194735B2 (en) Video encoding apparatus and video encoding method
KR101425602B1 (en) Method and apparatus for encoding/decoding image
US20060012719A1 (en) System and method for motion prediction in scalable video coding
JP2006140758A (en) Method, apparatus and program for encoding moving image
US20130044804A1 (en) Video Coding
JP4226172B2 (en) Video compression encoding apparatus and decoding apparatus using adaptive conversion method and method thereof
KR20090095012A (en) Method and apparatus for encoding and decoding image using consecutive motion estimation
CN103918262A (en) Method and system for structural similarity based rate-distortion optimization for perceptual video coding
US8594189B1 (en) Apparatus and method for coding video using consistent regions and resolution scaling
US20090323798A1 (en) Method and system for low-complexity slepian-wolf rate estimation in wyner-ziv video encoding
KR20070028404A (en) Method of storing pictures in a memory using compression coding and cost function including power consumption
US20180249160A1 (en) Vector quantization for video coding using codebook generated by selected training signals
KR101359500B1 (en) Quantization/Inverse Quantization Apparatus and Method and Video Encoding/Decoding Apparatus Using Same
US9628791B2 (en) Method and device for optimizing the compression of a video stream
KR101311410B1 (en) Methods of distributed video coding modifying group of pictures and apparatuses performing the same
KR20150095604A (en) Apparatus and method for video coding/decoding using adaptive intra prediction
KR101639434B1 (en) Wyner-Ziv coding and decoding system and method
KR101035746B1 (en) Method of distributed motion estimation for video encoder and video decoder
KR100219133B1 (en) Method and apparatus for selecting transform coefficient of transform encoding system
KR100978465B1 (en) Bi-prediction coding method and apparatus, bi-prediction decoding method and apparatus, and recording midium
KR100701740B1 (en) Apparatus and Method for encoding and decoding PI frame of digital visual data
KR100755388B1 (en) Method and apparatus for approximating distortion in video compression
Kodavalla et al. Distributed video coding: feedback-free architecture and implementation
KR100991586B1 (en) Distributed Video Coding Encoding and Decoding Device Estimating Feature of the Side Information
JP3884410B2 (en) Quantization step size determination method and digital signal encoding apparatus for digital signal encoding

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12840987

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 12840987

Country of ref document: EP

Kind code of ref document: A1