WO2013162249A1 - 비디오 인코딩 방법, 비디오 디코딩 방법 및 이를 이용하는 장치 - Google Patents

비디오 인코딩 방법, 비디오 디코딩 방법 및 이를 이용하는 장치 Download PDF

Info

Publication number
WO2013162249A1
WO2013162249A1 PCT/KR2013/003456 KR2013003456W WO2013162249A1 WO 2013162249 A1 WO2013162249 A1 WO 2013162249A1 KR 2013003456 W KR2013003456 W KR 2013003456W WO 2013162249 A1 WO2013162249 A1 WO 2013162249A1
Authority
WO
WIPO (PCT)
Prior art keywords
picture
leading
leading picture
bitstream
block
Prior art date
Application number
PCT/KR2013/003456
Other languages
English (en)
French (fr)
Inventor
헨드리헨드리
박승욱
전병문
박준영
김정선
정상오
김철근
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to KR1020207027364A priority Critical patent/KR102241998B1/ko
Priority to KR1020217031400A priority patent/KR102420153B1/ko
Priority to CN201380003980.4A priority patent/CN103959792B/zh
Priority to KR1020217010983A priority patent/KR102309609B1/ko
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to KR1020147008969A priority patent/KR102160958B1/ko
Priority to KR1020227023481A priority patent/KR102574868B1/ko
Priority to US14/354,937 priority patent/US9565432B2/en
Priority to EP13782395.1A priority patent/EP2760203A4/en
Publication of WO2013162249A1 publication Critical patent/WO2013162249A1/ko
Priority to US15/387,727 priority patent/US9912960B2/en
Priority to US15/892,650 priority patent/US10158872B2/en
Priority to US16/222,383 priority patent/US10511850B2/en
Priority to US16/677,192 priority patent/US10869052B2/en
Priority to US17/098,886 priority patent/US11330281B2/en
Priority to US17/725,121 priority patent/US11917178B2/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/43Hardware specially adapted for motion estimation or compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/65Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience
    • H04N19/68Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience involving the insertion of resynchronisation markers into the bitstream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
    • H04N19/895Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder in combination with error concealment

Definitions

  • the present invention relates to video compression technology, and more particularly, to a method for processing an image by parsing compressed image information, and an apparatus using the same.
  • video quality of the terminal device can be supported and the network environment is diversified, in general, video of general quality may be used in one environment, but higher quality video may be used in another environment. .
  • a consumer who purchases video content on a mobile terminal can view the same video content on a larger screen and at a higher resolution through a large display in the home.
  • the quality of the image for example, the image quality, the resolution of the image, the size of the image. It is necessary to provide scalability in the frame rate of video and the like. In addition, various image processing methods associated with such scalability should be discussed.
  • An object of the present invention is to provide a method for processing a leading picture in which no reference picture exists and an apparatus using the same.
  • Another object of the present invention is to provide a method for preventing an error of a decoding apparatus and processing an image, and an apparatus using the same.
  • Another object of the present invention is to provide a method for supporting random access to an image and enabling a first picture in which a CRA picture and an IDR picture are decoded in a bitstream, and an apparatus using the same.
  • Another object of the present invention is to provide a method capable of coping with an error occurring during image processing and an apparatus using the same.
  • An embodiment of the present invention provides a method of receiving a bitstream including a plurality of pictures, and if at least one reference picture for a leading picture is preceded by an output order and a decoding order is preceded by a random access point picture, And not outputting the leading picture.
  • the step of not outputting the leading picture may include removing from the bitstream and discarding the leading picture, and may further include decoding a picture after the removed leading picture. have.
  • the absence of a leading picture may mean that the leading picture is excluded from the decoding process and the output process.
  • the picture after the removed leading picture may be decoded after being delayed by a predetermined delay time.
  • the leading picture includes a first non-decodable first picture and a second decodable leading picture, and the step of removing the leading picture from the bitstream may exclude the first leading picture from a decoding process and an output process. .
  • the leading picture includes a first non-decodable first picture and a decodable second leading picture
  • the removing of the leading picture from the bitstream may include removing the first leading picture and the second leading picture from the bitstream. It may be removed from the stream and discarded.
  • leading picture may include a first non-decodable first picture
  • the step of removing the leading picture from the bitstream may remove the first leading picture from the bitstream.
  • the method may further include generating a flag signal that blocks the output of the unavailable reference picture.
  • the method may further include decoding the second leading picture.
  • the leading picture may include a picture that does not exist in the bitstream as a reference picture.
  • the random access point picture may be a clean random access (CRA) picture.
  • CRA clean random access
  • the method may further include receiving flag information indicating that at least one reference picture for the leading picture is not available.
  • the method may further include outputting error information of the bitstream, and decoding a picture after the leading picture. have.
  • the bitstream may be determined to be non-conformance.
  • the method may further include outputting error information of the bitstream, and decoding a picture after the leading picture.
  • a method for processing a leading picture without a reference picture and an apparatus using the same are provided.
  • a method for preventing an error of a decoding apparatus and processing an image and an apparatus using the same are provided.
  • a method for supporting random access to an image and enabling a first picture in which a CRA picture and an IDR picture are decoded in a bitstream and an apparatus using the same.
  • FIG. 1 is a block diagram schematically illustrating a video encoding apparatus according to an embodiment of the present invention.
  • FIG. 2 is a block diagram schematically illustrating a video decoding apparatus according to an embodiment of the present invention.
  • FIG. 3 is a diagram illustrating a hierarchical structure for coded images processed in the decoding apparatus of the present invention.
  • FIG. 4 is a diagram for describing a picture that can be randomly accessed.
  • FIG. 5 is a diagram for explaining an IDR picture.
  • FIG. 6 is a diagram for explaining a CRA picture.
  • FIG. 7 is a diagram for describing a case in which a picture preceding a leading picture is not available.
  • FIG. 8 is a control block diagram of an image processing apparatus according to an embodiment of the present invention.
  • FIG. 9 is a control flowchart illustrating an image processing method according to an embodiment of the present invention.
  • FIG. 10 is a diagram for describing removal of a leading picture according to an embodiment of the present invention.
  • FIG. 11 is a diagram for describing removal of a leading picture according to another embodiment of the present invention.
  • FIG. 12 is a diagram for describing removal of a leading picture according to another embodiment of the present invention.
  • FIG. 13 is a control flowchart illustrating an image processing method according to another embodiment of the present invention.
  • each of the components in the drawings described in the present invention are shown independently for the convenience of description of the different characteristic functions in the video encoding apparatus / decoding apparatus, each component is a separate hardware or separate software It does not mean that it is implemented.
  • two or more of each configuration may be combined to form one configuration, or one configuration may be divided into a plurality of configurations.
  • Embodiments in which each configuration is integrated and / or separated are also included in the scope of the present invention without departing from the spirit of the present invention.
  • the encoding apparatus 100 may include a picture divider 105, a predictor 110, a transformer 115, a quantizer 120, a reordering unit 125, an entropy encoding unit 130, An inverse quantization unit 135, an inverse transform unit 140, a filter unit 145, and a memory 150 are provided.
  • the picture dividing unit 105 may divide the input picture into at least one processing unit block.
  • the block as the processing unit may be a prediction unit (hereinafter referred to as a PU), a transform unit (hereinafter referred to as a TU), or a coding unit (hereinafter referred to as "CU"). It may be called.
  • the processing unit blocks divided by the picture divider 105 may have a quad-tree structure.
  • the predictor 110 includes an inter predictor for performing inter prediction and an intra predictor for performing intra prediction, as described below.
  • the prediction unit 110 generates a prediction block by performing prediction on the processing unit of the picture in the picture division unit 105.
  • the processing unit of the picture in the prediction unit 110 may be a CU, a TU, or a PU.
  • the prediction unit 110 may determine whether the prediction performed on the processing unit is inter prediction or intra prediction, and determine specific contents (eg, prediction mode, etc.) of each prediction method.
  • the processing unit in which the prediction is performed and the processing unit in which the details of the prediction method and the prediction method are determined may be different.
  • the prediction method and the prediction mode may be determined in units of PUs, and the prediction may be performed in units of TUs.
  • a prediction block may be generated by performing prediction based on information of at least one picture of a previous picture and / or a subsequent picture of the current picture.
  • a prediction block may be generated by performing prediction based on pixel information in a current picture.
  • a skip mode, a merge mode, a motion vector prediction (MVP), and the like can be used.
  • a reference picture may be selected for a PU and a reference block corresponding to the PU may be selected.
  • the reference block may be selected in integer pixel units.
  • a prediction block is generated in which a residual signal with the current PU is minimized and the size of the motion vector is also minimized.
  • the prediction block may be generated in integer sample units, or may be generated in sub-pixel units such as 1/2 pixel unit or 1/4 pixel unit.
  • the motion vector may also be expressed in units of integer pixels or less.
  • the residual may be used as the reconstructed block, and thus the residual may not be generated, transformed, quantized, or transmitted.
  • a prediction mode When performing intra prediction, a prediction mode may be determined in units of PUs, and prediction may be performed in units of PUs. In addition, a prediction mode may be determined in units of PUs, and intra prediction may be performed in units of TUs.
  • the prediction mode may have 33 directional prediction modes and at least two non-directional modes.
  • the non-directional mode may include a DC prediction mode and a planner mode (Planar mode).
  • a prediction block may be generated after applying a filter to a reference sample.
  • whether to apply the filter to the reference sample may be determined according to the intra prediction mode and / or the size of the current block.
  • the PU may be a block of various sizes / types, for example, in the case of inter prediction, the PU may be a 2N ⁇ 2N block, a 2N ⁇ N block, an N ⁇ 2N block, an N ⁇ N block (N is an integer), or the like.
  • the PU In the case of intra prediction, the PU may be a 2N ⁇ 2N block or an N ⁇ N block (where N is an integer).
  • the PU of the N ⁇ N block size may be set to apply only in a specific case.
  • the NxN block size PU may be used only for the minimum size CU or only for intra prediction.
  • PUs such as N ⁇ mN blocks, mN ⁇ N blocks, 2N ⁇ mN blocks, or mN ⁇ 2N blocks (m ⁇ 1) may be further defined and used.
  • the residual value (the residual block or the residual signal) between the generated prediction block and the original block is input to the converter 115.
  • the prediction mode information, the motion vector information, etc. used for the prediction are encoded by the entropy encoding unit 130 together with the residual value and transmitted to the decoding apparatus.
  • the transform unit 115 performs transform on the residual block in units of transform blocks and generates transform coefficients.
  • the transform block is a rectangular block of samples to which the same transform is applied.
  • the transform block can be a transform unit (TU) and can have a quad tree structure.
  • the transformer 115 may perform the transformation according to the prediction mode applied to the residual block and the size of the block.
  • the residual block is transformed using a discrete sine transform (DST), otherwise the residual block is transformed into a discrete cosine transform (DCT). Can be converted using.
  • DST discrete sine transform
  • DCT discrete cosine transform
  • the transform unit 115 may generate a transform block of transform coefficients by the transform.
  • the quantization unit 120 may generate quantized transform coefficients by quantizing the residual values transformed by the transform unit 115, that is, the transform coefficients.
  • the value calculated by the quantization unit 120 is provided to the inverse quantization unit 135 and the reordering unit 125.
  • the reordering unit 125 rearranges the quantized transform coefficients provided from the quantization unit 120. By rearranging the quantized transform coefficients, the encoding efficiency of the entropy encoding unit 130 may be increased.
  • the reordering unit 125 may rearrange the quantized transform coefficients in the form of a 2D block into a 1D vector form through a coefficient scanning method.
  • the entropy encoding unit 130 may perform entropy encoding on the quantized transform coefficients rearranged by the reordering unit 125.
  • Entropy encoding may include, for example, encoding methods such as Exponential Golomb, Context-Adaptive Variable Length Coding (CAVLC), and Context-Adaptive Binary Arithmetic Coding (CABAC).
  • the entropy encoding unit 130 may include quantized transform coefficient information, block type information, prediction mode information, partition unit information, PU information, transmission unit information, and motion vector of the CUs received from the reordering unit 125 and the prediction unit 110.
  • Various information such as information, reference picture information, interpolation information of a block, and filtering information may be encoded.
  • the entropy encoding unit 130 may apply a constant change to a parameter set or syntax to be transmitted.
  • the inverse quantizer 135 inversely quantizes the quantized values (quantized transform coefficients) in the quantizer 120, and the inverse transformer 140 inversely transforms the inverse quantized values in the inverse quantizer 135.
  • the reconstructed block may be generated by combining the residual values generated by the inverse quantizer 135 and the inverse transform unit 140 and the prediction blocks predicted by the prediction unit 110.
  • a reconstructed block is generated by adding a residual block and a prediction block through an adder.
  • the adder may be viewed as a separate unit (restore block generation unit) for generating a reconstruction block.
  • the filter unit 145 may apply a deblocking filter, an adaptive loop filter (ALF), and a sample adaptive offset (SAO) to the reconstructed picture.
  • ALF adaptive loop filter
  • SAO sample adaptive offset
  • the deblocking filter may remove distortion generated at the boundary between blocks in the reconstructed picture.
  • the adaptive loop filter may perform filtering based on a value obtained by comparing the reconstructed image with the original image after the block is filtered through the deblocking filter. ALF may be performed only when high efficiency is applied.
  • the SAO restores the offset difference from the original image on a pixel-by-pixel basis to the residual block to which the deblocking filter is applied, and is applied in the form of a band offset and an edge offset.
  • the filter unit 145 may not apply filtering to the reconstructed block used for inter prediction.
  • the memory 150 may store the reconstructed block or the picture calculated by the filter unit 145.
  • the reconstructed block or picture stored in the memory 150 may be provided to the predictor 110 that performs inter prediction.
  • the video decoding apparatus 200 includes an entropy decoding unit 210, a reordering unit 215, an inverse quantization unit 220, an inverse transform unit 225, a prediction unit 230, and a filter unit 235.
  • Memory 240 may be included.
  • the input bitstream may be decoded according to a procedure in which image information is processed in the video encoding apparatus.
  • VLC variable length coding
  • 'VLC' variable length coding
  • CABAC CABAC
  • Information for generating the prediction block among the information decoded by the entropy decoding unit 210 is provided to the predictor 230, and a residual value where entropy decoding is performed by the entropy decoding unit 210, that is, a quantized transform coefficient It may be input to the reordering unit 215.
  • the reordering unit 215 may reorder the information of the bitstream entropy decoded by the entropy decoding unit 210, that is, the quantized transform coefficients, based on the reordering method in the encoding apparatus.
  • the reordering unit 215 may reorder the coefficients expressed in the form of a one-dimensional vector by restoring the coefficients in the form of a two-dimensional block.
  • the reordering unit 215 may generate an array of coefficients (quantized transform coefficients) in the form of a 2D block by scanning coefficients based on the prediction mode applied to the current block (transform block) and the size of the transform block.
  • the inverse quantization unit 220 may perform inverse quantization based on the quantization parameter provided by the encoding apparatus and the coefficient values of the rearranged block.
  • the inverse transform unit 225 may perform inverse DCT and / or inverse DST on the DCT and the DST performed by the transform unit of the encoding apparatus with respect to the quantization result performed by the video encoding apparatus.
  • the inverse transformation may be performed based on a transmission unit determined by the encoding apparatus or a division unit of an image.
  • the DCT and / or DST in the encoding unit of the encoding apparatus may be selectively performed according to a plurality of pieces of information, such as a prediction method, a size and a prediction direction of the current block, and the inverse transform unit 225 of the decoding apparatus is configured in the transformation unit of the encoding apparatus.
  • Inverse transformation may be performed based on the performed transformation information.
  • the prediction unit 230 may generate the prediction block based on the prediction block generation related information provided by the entropy decoding unit 210 and the previously decoded block and / or picture information provided by the memory 240.
  • intra prediction for generating a prediction block based on pixel information in the current picture may be performed.
  • inter prediction on the current PU may be performed based on information included in at least one of a previous picture or a subsequent picture of the current picture.
  • motion information required for inter prediction of the current PU provided by the video encoding apparatus for example, a motion vector, a reference picture index, and the like, may be derived by checking a skip flag, a merge flag, and the like received from the encoding apparatus.
  • the reconstruction block may be generated using the prediction block generated by the predictor 230 and the residual block provided by the inverse transform unit 225.
  • FIG. 2 it is described that the reconstructed block is generated by combining the prediction block and the residual block in the adder.
  • the adder may be viewed as a separate unit (restore block generation unit) for generating a reconstruction block.
  • the residual is not transmitted and the prediction block may be a reconstruction block.
  • the reconstructed block and / or picture may be provided to the filter unit 235.
  • the filter unit 235 may apply deblocking filtering, sample adaptive offset (SAO), and / or ALF to the reconstructed block and / or picture.
  • SAO sample adaptive offset
  • the memory 240 may store the reconstructed picture or block to use as a reference picture or reference block and provide the reconstructed picture to the output unit.
  • FIG. 3 is a diagram illustrating a hierarchical structure for a coded image processed by a decoding apparatus.
  • a coded picture is divided into a network abstraction layer (NAL) between a video coding layer (VCL) that handles decoding of the picture and itself, and a subsystem that transmits and stores coded information. It is.
  • NAL network abstraction layer
  • VCL video coding layer
  • the NAL unit which is a basic unit of the NAL, serves to map a coded image to a bit string of a sub-system such as a file format, a real-time transport protocol (RTP), and the like according to a predetermined standard.
  • a sub-system such as a file format, a real-time transport protocol (RTP), and the like according to a predetermined standard.
  • RTP real-time transport protocol
  • a parameter set (picture parameter set, sequence parameter set, video parameter set) corresponding to a header such as a sequence and a picture, and a Supplemental Enhancement Information (SEI) message additionally necessary for the decoding process of an image are also included.
  • SEI Supplemental Enhancement Information
  • the NAL unit is composed of two parts: a NAL header and a raw byte sequence payload (RBSP) generated in the VCL.
  • the NAL header includes information on the type of the corresponding NAL unit.
  • the NAL unit is divided into a VCL NAL unit and a non-VCL NAL unit according to the RBSP generated in the VCL.
  • the VCL NAL unit refers to a NAL unit containing information about an image
  • the non-VCL NAL unit represents a NAL unit including information (a parameter set or an SEI message) necessary for decoding the image.
  • the VCL NAL unit may be divided into various types according to the nature and type of pictures included in the corresponding NAL unit.
  • FIG. 4 is a diagram for describing a picture that can be randomly accessed.
  • a random-accessible picture that is, an intra random access point (IRAP) picture that becomes a random access point, is the first picture in decoding order in a bitstream during random access and includes only an I slice.
  • IRAP intra random access point
  • FIG. 4 illustrates an output order or display order of a picture and a decoding order. As shown, the output order and decoding order of the pictures may be different. For convenience, the pictures are divided into predetermined groups and described.
  • Pictures belonging to the first group (I) represent the preceding picture in both the IRAP picture and the output order and the decoding order, and pictures belonging to the second group (II) are preceded in the output order but following the decoding order than the IRAP picture. Indicates.
  • the pictures of the last third group (III) are later in both output order and decoding order than IRAP pictures.
  • the pictures of the first group I may be decoded and output regardless of the IRAP picture.
  • Pictures belonging to the second group (II) that are output prior to the IRAP picture are called leading pictures, and the leading pictures may be problematic in the decoding process when the IRAP picture is used as a random access point. It is described in detail below.
  • a picture belonging to the third group (III) whose output and decoding order follows the IRAP picture is called a normal picture.
  • the normal picture is not used as the reference picture of the leading picture.
  • the random access point where random access occurs in the bitstream becomes an IRAP picture, and random access starts as the first puncher of the second group (II) is output.
  • the IRAP picture may be one of an instantaneous decoding refresh (IDR) picture and a clean random access (CRA) picture.
  • IDR instantaneous decoding refresh
  • CRA clean random access
  • FIG. 5 is a diagram for explaining an IDR picture.
  • An IDR picture is a picture that becomes a random access point when a group of pictures has a closed structure. Since the IDR picture is an IRAP picture, it includes only I slices, and may be the first picture in decoding order in the bitstream, or may be in the middle of the bitstream. When an IDR picture is decoded, all reference pictures stored in a decoded picture buffer (DPB) are marked as “unused for reference”.
  • DPB decoded picture buffer
  • Bars shown in FIG. 5 indicate pictures and arrows indicate reference relationships as to whether a picture can use another picture as a reference picture.
  • the x mark displayed on the arrow indicates that the picture (s) cannot refer to the picture to which the arrow points.
  • the POC of the IDR picture is 32, the POC is 25 to 31, and the picture that is output before the IDR picture is the leading pictures 510.
  • Pictures with a POC greater than 33 correspond to the normal picture 520.
  • the leading pictures 510 preceding the IDR picture may use the leading picture different from the IDR picture as the reference picture, but cannot use the past picture 530 preceding the leading picture 510 as the reference picture.
  • the normal pictures 520 following the IDR picture may be decoded with reference to the IDR picture and the leading picture and other normal pictures.
  • FIG. 6 is a diagram for explaining a CRA picture.
  • a CRA picture is a picture that becomes a random access point when a group of pictures has an open structure. Since the CRA picture is also an IRAP picture, it contains only I slices, and may be the first picture in decoding order in the bitstream, or may be in the middle of the bitstream for normal play.
  • the CRA picture may exist in the middle of the bitstream as a random access point if the coded picture is spliced or the bitstream is broken in the middle.
  • the bars shown in FIG. 6 represent pictures and arrows represent reference relationships as to whether a picture can use another picture as a reference picture.
  • the x mark displayed on the arrow indicates that the picture or pictures cannot refer to the picture indicated by the arrow.
  • the leading pictures 610 that precede the CRA picture may use both the CRA picture and other leading pictures and past pictures 630 that precede the leading pictures 610 as reference pictures.
  • the normal pictures 620 following the CRA picture may be decoded with reference to a normal picture different from the CRA picture, but the leading pictures 610 cannot be used as the reference picture.
  • FIG. 7 is a diagram for describing a case in which a picture preceding a leading picture is not available.
  • the leading pictures 710 are output before the CRA picture because the output order precedes the CRA picture, but are decoded after the CRA picture.
  • the leading pictures 710 may refer to at least one of the preceding pictures 730.
  • the decoding order is the CRA picture.
  • the preceding pictures 730 preceding may be unavailable.
  • the preceding pictures 730 which may be the reference pictures of the leading pictures 710, become unavailable, the leading picture referring to the unavailable picture may not be decoded normally.
  • the case in which the picture to be referred to by the leading picture is not available may include a case in which the leading picture does not exist in the bitstream as a reference picture, or a picture in which the leading picture refers to is not present in the DPB.
  • the image processing apparatus does not output a leading picture referring to a reference picture that is not available to solve the above problem.
  • the image processing apparatus 800 includes a bitstream receiver 810 and an image processor 820.
  • the image processing apparatus 800 may be implemented as a module or an apparatus including an image processing unit 820 that performs a decoding process.
  • the image processing apparatus 800 may be implemented as a television, a video reproducing apparatus, and various terminal devices capable of decoding and outputting an image.
  • the bitstream receiver 810 receives a bitstream including a plurality of pictures.
  • bitstream received by the bitstream receiver 810 is decoded by the image processor 820 and then output as an image.
  • the bitstream receiver 810 may include a parser that parses an input bitstream and obtains information necessary for decoding a picture.
  • the image processor 820 may be implemented as a decoding apparatus including the components of FIG. 2 or a decoding module that performs decoding.
  • the image processor 820 according to the present exemplary embodiment determines whether to output the leading picture according to whether the reference picture is available.
  • FIG. 9 is a control flowchart illustrating an image processing method according to the image processing apparatus 800.
  • the image processing apparatus 800 receives a bitstream including a plurality of pictures (S901).
  • the picture may include an IDR picture or a CRA picture that becomes a random access point.
  • the picture may include a leading picture that precedes the output order but post-decodes the random access point picture.
  • the image processor 820 does not output the leading picture (S902).
  • the step of not outputting the leading picture may include removing the leading picture from the bitstream and discarding it. Discarded leading pictures are excluded from the decoding process and the output process.
  • the image processor 820 determines that the bitstream satisfies a predetermined bitstream conformance, and excludes it from the output image. ).
  • the image processing apparatus 800 may appropriately respond to a bitstream in which random access occurs suddenly.
  • the image processor 820 After removing the leading picture in the decoding process and the output process, the image processor 820 decodes the picture after the removed leading picture (S903).
  • a picture after the removed leading picture refers to a picture that can be normally decoded regardless of a reference picture lost in the bitstream or a reference picture that does not exist.
  • the image processor 820 delays the time by a predetermined delay time to maintain the picture bit string of the input bitstream, that is, to prevent the overflow or underflow of the buffer for storing the picture, and then the subsequent picture.
  • Decode The image processor 820 may include a coded picture buffer (CPB) storing a coded picture and a decoded picture buffer (DPB) storing a decoded picture.
  • CPB coded picture buffer
  • DPB decoded picture buffer
  • FIG. 10 is a diagram for describing removal of a leading picture according to an embodiment of the present invention.
  • the leading picture may include a first leading picture 1010 and a second leading picture 1020.
  • Pictures included in the first group I may include pictures that the leading picture cannot refer to.
  • the first group I may include pictures that are currently to be decoded, that is, pictures that are completely independent of the CRA picture and the leading pictures 1010 and 1020.
  • the first leading picture 1010 refers to a picture that is not normally decoded, such as referring to an unavailable reference picture, and the second leading picture 1020 is a picture that can be normally decoded regardless of the first leading picture 1010. Means.
  • leading pictures 1010 and 1020 B0, B1, and B2 are first leading pictures 1010, and B3 to B6 are second leading pictures 1020.
  • the first non-decoded first picture 1010 is excluded from the decoding process and the output process.
  • the first leading picture 1010 may be removed and discarded in the bitstream.
  • the image processor 820 decodes and outputs the second leading picture 1020 after the first leading picture 1010 excluded from the decoding process and the output process. Random access is started while the second leading picture 1020 is output.
  • the image processor 820 may delay the decoding time of the second leading picture 1020 in consideration of the bitstream timing of the removed leading picture 1010.
  • FIG. 11 is a diagram for describing removal of a leading picture according to another embodiment of the present invention.
  • a leading picture may include a first leading picture 1110 and a second leading picture 1120.
  • the first leading picture 1110 refers to a picture that is not normally decoded, such as referring to an unusable reference picture, and the second leading picture 1120 is independent of the first leading picture 1110. Means a picture that can be normally decoded.
  • B0, B1, and B2 are the first leading pictures 1110
  • B3 to B6 are the second leading pictures 1120.
  • the image processor 820 may exclude not only the first decoded picture 1110 that is not decodable but also the second decoded picture 1120 that can be normally decoded from the decoding process and the output process.
  • the image processor 820 may remove and discard the first leading picture 1110 and the second leading picture 1120 from the bitstream.
  • the image processor 820 decodes the pictures after the first leading picture 1110 and the second leading picture 1120, that is, the pictures of the third group (III), which are excluded from the decoding and output processes.
  • the image processor 820 may decode a subsequent picture after delaying a time by a predetermined delay time in order to prevent overflow or underflow of the buffer for the removed leading pictures 1110 and 1120.
  • the pictures of the third group (III) are decoded, and the decoded CRA pictures and pictures belonging to the third group (III) are continuously displayed.
  • FIG. 12 is a diagram for describing removal of a leading picture according to another embodiment of the present invention.
  • the leading picture may include only the first leading picture 1210 that references a reference picture that is not available. That is, the pictures B0 to B6 of the second group (II) after the CRA picture correspond to the first leading picture 1210 referring to a picture that is not available.
  • the image processor 820 may exclude all of the first non-decoded first picture 1210 from the decoding process and the output process.
  • the first leading picture 1210 may be removed and discarded in the bitstream.
  • the image processor 820 decodes and outputs the pictures of the third group III after the first leading picture 1210 excluded from the decoding and output processes.
  • the image processor 820 decodes the pictures of the third group (III) when the delay time elapses after the CRA picture that is the random access point is decoded, and successively decodes the decoded CRA picture and the pictures of the third group (III). Output
  • FIG. 13 is a control flowchart illustrating an image processing method according to another embodiment of the present invention.
  • a bitstream including a plurality of pictures is received (S1301).
  • the picture may include pictures that are random access points, an output order that precedes the random access point picture, and a decoding order that precedes the leading picture and the normal picture that the output order and decoding order follow the random access point picture.
  • the leading picture may include at least one of a non-decodable first leading picture and a decodable second leading picture.
  • the first leading picture may refer to a picture that is not present in the bitstream or a picture that is not available.
  • the image processor If the first leading picture exists in the bitstream, the image processor generates an unavailable reference picture for the first leading picture (S1302).
  • the image processor Although the first leading picture is not output and does not affect the decoding process of another picture, the image processor generates an unavailable reference picture, that is, a virtual reference picture for the first leading picture, as if the first leading picture is decoded. Works together.
  • the sample value of the unavailable reference picture may be generated as an intermediate value of the sample value that the picture may have.
  • the image processor sets a flag signal for the output of the picture to 0 so that the non-available reference picture is not output, and processes the first leading picture not to be output (S1303).
  • the image processor After processing the first non-decodable first picture, the image processor performs a decoding process of the second leading picture which can be normally decoded.
  • the image processing apparatus may receive flag information about a leading picture and process the leading picture based on the received flag information.
  • Table 1 exemplarily shows a syntax including flag information about a leading picture.
  • broken_link_leading_pics_enable_flag of Table 1 When broken_link_leading_pics_enable_flag of Table 1 is 1, at least one reference picture for a leading picture is not available, and if broken_link_leading_pics_enable_flag is 0, it indicates that a leading picture does not include a reference picture that is not available. For example, broken_link_leading_pics_enable_flag is 1 when the reference picture is lost.
  • the image processor may remove the leading picture including the unavailable reference picture in the decoding process and the output process.
  • a leading picture may include a first leading picture that cannot be normally decoded and a second leading picture that can be normally decoded.
  • the image processor may remove only the first leading picture during decoding and output, or may remove all leading pictures during decoding and output regardless of whether the leading picture is the first leading picture or the second leading picture.
  • the image processor may generate an unusable reference picture for the first leading picture that the reference picture is not available. In this case, the generated unavailable reference picture and the first leading picture are not output.
  • the image processor may receive flag information indicating that at least one reference picture for a leading picture is not available, and may perform any one of operations described with reference to FIGS. 10 to 13.
  • the image processing apparatus may receive flag information such as broken_link_leading_pics_enable_flag, but may set broken_link_leading_pics_enable_flag by grasping the nature of the picture included in the bitstream.
  • the image processor may remove the leading picture during decoding and output according to the flag information set at the higher system level.
  • the image processing unit when the image processing unit receives the flag information of Table 1, the image processor determines that the received bitstream does not satisfy a predetermined standard conformity, and the subsequent operation corresponding to the case where the bitstream does not satisfy the standard conformance. Can be performed.
  • the image processor may stop decoding the image and output an error generated in the decoding process.
  • the error information may be reported to an upper system level of the image processor, for example, an application or video player level.
  • the image processor may receive a subsequent operation for an error from an upper system level or may perform an operation set as a default.
  • the image processor may output an error and then decode the decodable pictures after the leading picture.
  • the image processing apparatus may determine that the bitstream is non-conformance.
  • the image processor determines that the bitstream does not conform to the standard conformance even if the picture information for the leading picture is not received, and the bitstream satisfies the conformance. Subsequent actions can be performed for failures.
  • the image processor may stop the decoding process and output an error generated during the decoding process.
  • the error information may be reported to an upper system level of the image processor, for example, an application or video player level.
  • the image processor may receive a subsequent operation for an error from an upper system level or may perform an operation set as a default.
  • the image processor may output an error and then decode the decodable pictures after the leading picture.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 인터 레이어 예측 방법 및 이를 이용한 장치에 대한 발명으로, 현재 블록에 대응하는 참조 레이어의 참조 블록의 복원값을 업샘플링한 값으로 구성된 제1 블록을 생성하는 하는 단계와, 상기 현재 블록의 인트라 예측 모드에 기초하여 유도된 예측값으로 구성된 제2 블록을 생성하는 단계와, 상기 제1 블록 및 상기 제2 블록의 샘플값을 조합하여 상기 현재 블록의 예측 블록을 생성하는 단계를 포함할 수 있다. 이로 인하여, 다른 레이어의 인트라 예측 모드 정보를 이용하여 현재 레이어에 대한 인트라 예측을 수행할 수 있다.

Description

비디오 인코딩 방법, 비디오 디코딩 방법 및 이를 이용하는 장치
본 발명은 비디오 압축 기술에 관한 것으로서 더 구체적으로는 압축된 영상 정보를 파싱하여 영상을 처리하는 방법 및 이를 이용하는 장치에 관한 것이다.
최근 고해상도, 고품질의 영상에 대한 요구가 다양한 응용 분야에서 증가하고 있다. 영상이 고해상도를 가지고 고품질이 될수록 해당 영상에 관한 정보량도 함께 증가하고 있다.
정보량의 증가로 인해 다양한 성능의 장치와 다양한 환경의 네트워크가 등장하고 있다. 다양한 성능의 장치와 다양한 환경의 네트워크가 등장함에 따라서, 동일한 콘텐츠를 다양한 품질로 이용할 수 있게 되었다.
구체적으로, 단말 장치가 지원할 수 있는 품질의 영상이 다양해지고, 구축된 네트워크 환경이 다양해짐으로써, 어떤 환경에서는 일반적인 품질의 영상을 이용하지만, 또 다른 환경에서는 더 높은 품질의 영상을 이용할 수 있게 된다.
예를 들어, 휴대 단말에서 비디오 콘텐츠를 구매한 소비자가 가정 내 대화면의 디스플레이를 통해 동일한 비디오 콘텐츠를 더 큰 화면과 더 높은 해상도로 감상할 수 있게 되는 것이다.
최근에는 HD(High Definition) 해상도를 가지는 방송이 서비스되면서 많은 사용자들은 이미 고해상도, 고화질의 영상에 익숙해지고 있고, 서비스 제공자와 사용자들은 HDTV와 더불어 HDTV의 4배 이상의 해상도를 갖는 UHD(Ultra High Definition)의 서비스에도 관심을 기울이고 있다.
따라서, 다양한 환경에서 사용자가 요구하는 영상 서비스를 품질에 따라서 다양하게 제공하기 위해 고용량 비디오에 대한 고효율의 인코딩/디코딩 방법을 기반으로 영상의 품질, 예컨대 영상의 화질, 영상의 해상도, 영상의 크기, 비디오의 프레임 레이트 등에 스케일러빌러티를 제공하는 것이 필요하다. 또한, 이러한 스케일러빌러티에 수반되는 다양한 영상 처리 방법이 논의되어야 한다.
본 발명은 참조 픽처가 존재하지 않는 리딩 픽처를 처리하는 방법 및 이를 이용하는 장치를 제공하는 것을 목적으로 한다.
또한, 본 발명은 디코딩 장치의 에러를 방지하고 영상을 처리하는 방법 및 이를 이용하는 장치를 제공하는 것을 목적으로 한다.
또한, 본 발명은 영상에 대한 랜덤 억세스를 지원하고, CRA 픽처와 IDR 픽처가 비트스트림에서 디코딩되는 첫 번째 픽처가 가능하게 하는 방법 및 이를 이용하는 장치를 제공하는 것을 목적으로 한다.
또한, 본 발명의 다른 형태는 영상 처리 중 발생한 에러에 대하여 대응할 수 있는 방법 및 이를 이용하는 장치를 제공하는 것을 목적으로 한다.
본 발명의 일 실시형태는 복수의 픽처를 포함하는 비트스트림을 수신하는 단계와, 랜덤 억세스 포인트 픽처보다 출력 순서가 선행하고 디코딩 순서는 후행하는 리딩 픽처를 위한 적어도 하나의 참조 픽처가 가용하지 않으면, 상기 리딩 픽처를 출력하지 않는 단계를 포함할 수 있다.
상기 리딩 픽처를 출력하지 않는 단계는 상기 리딩 픽처를 상기 비트스트림으로부터 제거하여 버리는 단계(remove from the bitstream and discard)를 포함하고, 상기 제거된 리딩 픽처 이후의 픽처를 디코딩 하는 단계를 더 포함할 수 있다.
리딩 픽처가 출력되지 않는 것은 상기 리딩 픽처는 디코딩 과정 및 출력 과정에서 제외되는 것을 의미할 수 있다.
상기 제거된 리딩 픽처 이후의 픽처는 소정의 지연 시간만큼 지연된 후 디코딩 될 수 있다.
상기 리딩 픽처는 디코딩 불가능한 제1 리딩 픽처와 디코딩 가능한 제2 리딩 픽처를 포함하고, 상기 리딩 픽처를 상기 비트스트림으로부터 제거하여 버리는 단계는 상기 제1 리딩 픽처를 디코딩 과정 및 출력 과정에서 제외시킬 수 있다.
한편, 상기 리딩 픽처는 디코딩 불가능한 제1 리딩 픽처와 디코딩 가능한 제2 리딩 픽처를 포함하고, 상기 리딩 픽처를 상기 비트스트림으로부터 제거하여 버리는 단계는 상기 제1 리딩 픽처 및 상기 제2 리딩 픽처를 상기 비트스트림으로부터 제거하여 버릴 수도 있다.
또한, 상기 리딩 픽처는 디코딩 불가능한 제1 리딩 픽처를 포함할 수 있고, 상기 리딩 픽처를 상기 비트스트림으로부터 제거하여 버리는 단계는 상기 제1 리딩 픽처를 상기 비트스트림으로부터 제거하여 버릴 수도 있다.
상기 리딩 픽처는 디코딩 불가능한 제1 리딩 픽처와 디코딩 가능한 제2 리딩 픽처를 포함할 때, 상기 제1 리딩 픽처를 위한 비가용 참조 픽처를 생성하는 단계와; 상기 비가용 참조 픽처의 출력을 차단하는 플래그 신호를 생성하는 단계를 더 포함할 수 있다.
그런 후, 상기 제2 리딩 픽처를 디코딩 하는 단계를 더 포함할 수 있다.
상기 리딩 픽처는 상기 비트스트림 내 존재하지 않는 픽처를 참조 픽처로 포함할 수 있다.
상기 랜덤 억세스 포인트 픽처는 CRA(clean random access) 픽처일 수 있다.
상기 리딩 픽처를 위한 적어도 하나의 참조 픽처가 가용하지 않음을 지시하는 플래그 정보를 수신하는 단계를 더 포함할 수도 있다.
상기 플래그 정보를 통하여 상기 리딩 픽처를 위한 적어도 하나의 참조 픽처가 가용하지 않는 것으로 판단되면, 상기 비트스트림의 에러 정보를 출력하는 단계와, 상기 리딩 픽처 이후의 픽처를 디코딩 하는 단계를 더 포함할 수 있다.
상기 리딩 픽처를 위한 적어도 하나의 참조 픽처가 가용하지 않으면, 상기 비트스트림이 소정의 규격적합성을 따르지 않는 것(non-conformance)으로 판단할 수 있다,
비트스트림이 소정의 규격적합성을 따르지 않는 것(non-conformance)으로 판단되면, 상기 비트스트림의 에러정보를 출력하는 단계와, 상기 리딩 픽처 이후의 픽처를 디코딩 하는 단계를 더 포함할 수 있다.
본 발명의 일 실시예에 따르면, 참조 픽처가 존재하지 않는 리딩 픽처를 처리하는 방법 및 이를 이용하는 장치가 제공된다.
또한, 본 발명의 일 실시예에 따르면 디코딩 장치의 에러를 방지하고 영상을 처리하는 방법 및 이를 이용하는 장치가 제공된다.
또한, 본 발명의 일 실시예에 따르면 영상에 대한 랜덤 억세스를 지원하고, CRA 픽처와 IDR 픽처가 비트스트림에서 디코딩되는 첫 번째 픽처가 가능하게 하는 방법 및 이를 이용하는 장치가 제공된다.
또한, 본 발명의 다른 형태에 따르면 영상 처리 중 발생한 에러에 대하여 대응할 수 있는 방법 및 이를 이용하는 장치가 제공된다.
도 1은 본 발명의 일 실시예에 따른 비디오 인코딩 장치를 개략적으로 도시한 블록도이다.
도 2는 본 발명의 일 실시예에 따른 비디오 디코딩 장치를 개략적으로 도시한 블록도이다.
도 3은 본 발명의 디코딩 장치에서 처리되는 코딩된 영상에 대한 계층 구조를 도시한 도면이다.
도 4는 랜덤 억세스가 가능한 픽처를 설명하기 위한 도면이다.
도 5는 IDR 픽처를 설명하기 위한 도면이다.
도 6은 CRA 픽처를 설명하기 위한 도면이다.
도 7은 리딩 픽처에 선행하는 픽처가 비가용한 경우를 설명하기 위한 도면이다.
도 8은 본 발명의 일 실시예에 따른 영상 처리 장치의 제어 블록도이다.
도 9는 본 발명의 일 실시예에 따른 영상의 처리 방법을 설명하기 위한 제어 흐름도이다.
도 10은 본 발명의 일 실시예에 따라 리딩 픽처의 제거를 설명하기 위한 도면이다.
도 11은 본 발명의 다른 실시예에 따라 리딩 픽처의 제거를 설명하기 위한 도면이다.
도 12는 본 발명의 또 다른 실시예에 따라 리딩 픽처의 제거를 설명하기 위한 도면이다.
도 13은 본 발명의 또 다른 실시예에 따른 영상의 처리 방법을 설명하기 위한 제어 흐름도이다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니다. 본 명세서에서 사용하는 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명의 기술적 사상을 한정하려는 의도로 사용되는 것은 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성 요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성 요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
한편, 본 발명에서 설명되는 도면상의 각 구성들은 비디오 인코딩 장치/디코딩 장치에서 서로 다른 특징적인 기능들에 관한 설명의 편의를 위해 독립적으로 도시된 것으로서, 각 구성들이 서로 별개의 하드웨어나 별개의 소프트웨어로 구현된다는 것을 의미하지는 않는다. 예컨대, 각 구성 중 두 개 이상의 구성이 합쳐져 하나의 구성을 이룰 수도 있고, 하나의 구성이 복수의 구성으로 나뉘어질 수도 있다. 각 구성이 통합 및/또는 분리된 실시예도 본 발명의 본질에서 벗어나지 않는 한 본 발명의 권리범위에 포함된다.
이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예를 보다 상세하게 설명하고자 한다. 이하, 도면상의 동일한 구성 요소에 대해서는 동일한 참조 부호를 사용하고 동일한 구성 요소에 대해서 중복된 설명은 생략한다.
도 1은 본 발명의 일 실시예에 따른 비디오 인코딩 장치를 개략적으로 도시한 블록도이다. 도 1을 참조하면, 인코딩 장치(100)는 픽처 분할부(105), 예측부(110), 변환부(115), 양자화부(120), 재정렬부(125), 엔트로피 인코딩부(130), 역양자화부(135), 역변환부(140), 필터부(145) 및 메모리(150)를 구비한다.
픽처 분할부(105)는 입력된 픽처를 적어도 하나의 처리 단위 블록으로 분할할 수 있다. 이때, 처리 단위로서의 블록은 예측 유닛(Prediction Unit, 이하 ‘PU’라 함)일 수도 있고, 변환 유닛(Transform Unit, 이하 ‘TU’라 함)일 수도 있으며, 코딩 유닛(Coding Unit, 이하 ‘CU’라 함)일 수도 있다.
픽처 분할부(105)에서 분할되는 처리 단위 블록들은 쿼드 트리(quad-tree) 구조를 가질 수 있다.
예측부(110)는 후술하는 바와 같이, 인터 예측을 수행하는 인터 예측부와 인트라 예측을 수행하는 인트라 예측부를 포함한다. 예측부(110)는, 픽처 분할부(105)에서 픽처의 처리 단위에 대하여 예측을 수행하여 예측 블록을 생성한다. 예측부(110)에서 픽처의 처리 단위는 CU일 수도 있고, TU일 수도 있고, PU일 수도 있다. 또한, 예측부(110)는 해당 처리 단위에 대하여 실시되는 예측이 인터 예측인지 인트라 예측인지를 결정하고, 각 예측 방법의 구체적인 내용(예컨대, 예측 모드 등)을 정할 수 있다. 이때, 예측이 수행되는 처리 단위와 예측 방법 및 예측 방법의 구체적인 내용이 정해지는 처리 단위는 다를 수 있다. 예컨대, 예측의 방법과 예측 모드 등은 PU 단위로 결정되고, 예측의 수행은 TU 단위로 수행될 수도 있다.
인터 예측을 통해서는 현재 픽처의 이전 픽처 및/또는 이후 픽처 중 적어도 하나의 픽처의 정보를 기초로 예측을 수행하여 예측 블록을 생성할 수 있다. 또한, 인트라 예측을 통해서는 현재 픽처 내의 픽셀 정보를 기초로 예측을 수행하여 예측 블록을 생성할 수 있다.
인터 예측의 방법으로서, 스킵(skip) 모드, 머지(merge) 모드, MVP(Motion Vector Predtiction) 등을 이용할 수 있다. 인터 예측에서는 PU에 대하여, 참조 픽처를 선택하고 PU에 대응하는 참조 블록을 선택할 수 있다. 참조 블록은 정수 픽셀 단위로 선택될 수 있다. 이어서, 현재 PU와의 레지듀얼(residual) 신호가 최소화되며 움직임 벡터 크기 역시 최소가 되는 예측 블록이 생성된다.
예측 블록은 정수 샘플 단위로 생성될 수도 있고, 1/2 픽셀 단위 또는 1/4 픽셀 단위와 같이 정수 이하 픽셀 단위로 생성될 수도 있다. 이때, 움직임 벡터 역시 정수 픽셀 이하의 단위로 표현될 수 있다.
인터 예측을 통해 선택된 참조 픽처의 인덱스, 움직임 벡터(ex. Motion Vector Predictor), 레지듀얼 신호 등의 정보는 엔트로피 인코딩되어 디코딩 장치에 전달된다. 스킵 모드가 적용되는 경우에는 레지듀얼을 예측 블록을 복원 블록으로 할 수 있으므로, 레지듀얼을 생성, 변환, 양자화, 전송하지 않을 수 있다.
인트라 예측을 수행하는 경우에는, PU 단위로 예측 모드가 정해져서 PU 단위로 예측이 수행될 수 있다. 또한, PU 단위로 예측 모드가 정해지고 TU 단위로 인트라 예측이 수행될 수도 있다.
인트라 예측에서 예측 모드는 33개의 방향성 예측 모드와 적어도 2개 이상의 비방향성 모드를 가질 수 있다. 비향성성 모드는 DC 예측 모드 및 플래이너 모드(Planar 모드)을 포함할 수 있다.
인트라 예측에서는 참조 샘플에 필터를 적용한 후 예측 블록을 생성할 수 있다. 이때, 참조 샘플에 필터를 적용할 것인지는 현재 블록의 인트라 예측 모드 및/또는 사이즈에 따라 결정될 수 있다.
PU는 다양한 사이즈/형태의 블록일 수 있으며, 예컨대 인터 예측의 경우에 PU는 2N×2N 블록, 2N×N 블록, N×2N 블록, 또는 N×N 블록 (N은 정수) 등일 수 있다. 인트라 예측의 경우에 PU는 2N×2N 블록 또는 N×N 블록 (N은 정수) 등일 수 있다. 이때, N×N 블록 크기의 PU는 특정한 경우에만 적용하도록 설정할 수 있다. 예컨대 최소 크기 CU에 대해서만 NxN 블록 크기의 PU를 이용하도록 정하거나 인트라 예측에 대해서만 이용하도록 정할 수도 있다. 또한, 상술한 크기의 PU 외에, N×mN 블록, mN×N 블록, 2N×mN 블록 또는 mN×2N 블록 (m<1) 등의 PU를 더 정의하여 사용할 수도 있다.
생성된 예측 블록과 원본 블록 사이의 레지듀얼 값(레지듀얼 블록 또는 레지듀얼 신호)은 변환부(115)로 입력된다. 또한, 예측을 위해 사용한 예측 모드 정보, 움직임 벡터 정보 등은 레지듀얼 값과 함께 엔트로피 인코딩부(130)에서 인코딩되어 디코딩 장치에 전달된다.
변환부(115)는 변환 블록 단위로 레지듀얼 블록에 대한 변환을 수행하고 변환 계수를 생성한다.
변환 블록은 샘플들의 직사각형 블록으로서 동일한 변환이 적용되는 블록이다. 변환 블록은 변환 유닛(TU)일 수 있으며, 쿼드 트리(quad tree) 구조를 가질 수 있다.
변환부(115)는 레지듀얼 블록에 적용된 예측 모드와 블록의 크기에 따라서 변환을 수행할 수 있다.
예컨대, 레지듀얼 블록에 인트라 예측이 적용되었고 블록이 4x4의 레지듀얼 배열이라면, 레지듀얼 블록을 DST(Discrete Sine Transform)를 이용하여 변환하고, 그 외의 경우라면 레지듀얼 블록을 DCT(Discrete Cosine Transform)를 이용하여 변환할 수 있다.
변환부(115)는 변환에 의해 변환 계수들의 변환 블록을 생성할 수 있다.
양자화부(120)는 변환부(115)에서 변환된 레지듀얼 값들, 즉 변환 계수들을 양자화하여 양자화된 변환 계수를 생성할 수 있다. 양자화부(120)에서 산출된 값은 역양자화부(135)와 재정렬부(125)에 제공된다.
재정렬부(125)는 양자화부(120)로부터 제공된 양자화된 변환 계수를 재정렬한다. 양자화된 변환 계수를 재정렬함으로써 엔트로피 인코딩부(130)에서의 인코딩 효율을 높일 수 있다.
재정렬부(125)는 계수 스캐닝(Coefficient Scanning) 방법을 통해 2차원 블록 형태의 양자화된 변환 계수들을 1차원의 벡터 형태로 재정렬할 수 있다.
엔트로피 인코딩부(130)는 재정렬부(125)에 의해 재정렬된 양자화된 변환 계수들에 대한 엔트로피 인코딩을 수행할 수 있다. 엔트로피 인코딩에는 예를 들어, 지수 골롬(Exponential Golomb), CAVLC(Context-Adaptive Variable Length Coding), CABAC(Context-Adaptive Binary Arithmetic Coding) 등과 같은 인코딩 방법을 사용할 수 있다. 엔트로피 인코딩부(130)는 재정렬부(125) 및 예측부(110)로부터 전달받은 CU의 양자화된 변환 계수 정보 및 블록 타입 정보, 예측 모드 정보, 분할 단위 정보, PU 정보 및 전송 단위 정보, 움직임 벡터 정보, 참조 픽처 정보, 블록의 보간 정보, 필터링 정보 등 다양한 정보를 인코딩할 수 있다.
또한, 엔트로피 인코딩부(130)는 필요한 경우에, 전송하는 파라미터 셋(parameter set) 또는 신택스에 일정한 변경을 가할 수도 있다.
역양자화부(135)는 양자화부(120)에서 양자화된 값(양자화된 변환 계수)들을 역양자화하고, 역변환부(140)는 역양자화부(135)에서 역양자화된 값들을 역변환한다.
역양자화부(135) 및 역변환부(140)에서 생성된 레지듀얼 값과 예측부(110)에서 예측된 예측 블록이 합쳐져 복원 블록(Reconstructed Block)이 생성될 수 있다.
도 1에서는 가산기를 통해서, 레지듀얼 블록과 예측 블록이 합쳐져 복원 블록이 생성되는 것으로 설명하고 있다. 이때, 가산기를 복원 블록을 생성하는 별도의 유닛(복원 블록 생성부)로 볼 수도 있다.
필터부(145)는 디블록킹 필터, ALF(Adaptive Loop Filter), SAO(Sample Adaptive Offset)를 복원된 픽처에 적용할 수 있다.
디블록킹 필터는 복원된 픽처에서 블록 간의 경계에 생긴 왜곡을 제거할 수 있다. ALF(Adaptive Loop Filter)는 디블록킹 필터를 통해 블록이 필터링된 후 복원된 영상과 원래의 영상을 비교한 값을 기초로 필터링을 수행할 수 있다. ALF는 고효율을 적용하는 경우에만 수행될 수도 있다. SAO는 디블록킹 필터가 적용된 레지듀얼 블록에 대하여, 픽셀 단위로 원본 영상과의 오프셋 차이를 복원하며, 밴드 오프셋(Band Offset), 에지 오프셋(Edge Offset) 등의 형태로 적용된다.
한편, 인터 예측에 사용되는 복원 블록에 대해서 필터부(145)는 필터링을 적용하지 않을 수도 있다.
메모리(150)는 필터부(145)를 통해 산출된 복원 블록 또는 픽처를 저장할 수 있다. 메모리(150)에 저장된 복원 블록 또는 픽처는 인터 예측을 수행하는 예측부(110)에 제공될 수 있다.
도 2는 본 발명의 일 실시예에 따른 비디오 디코딩 장치를 개략적으로 나타낸 블록도이다. 도 2를 참조하면, 비디오 디코딩 장치(200)는 엔트로피 디코딩부(210), 재정렬부(215), 역양자화부(220), 역변환부(225), 예측부(230), 필터부(235) 메모리(240)를 포함할 수 있다.
비디오 인코딩 장치에서 영상 비트스트림이 입력된 경우, 입력된 비트스트림은 비디오 인코딩 장치에서 영상 정보가 처리된 절차에 따라서 디코딩될 수 있다.
예컨대, 비디오 인코딩 장치에서 엔트로피 인코딩을 수행하기 위해 CAVLC 등의 가변 길이 부호화(Variable Length Coding: VLC, 이하 ‘VLC’ 라 함)가 사용된 경우에, 엔트로피 디코딩부(210)도 인코딩 장치에서 사용한 VLC 테이블과 동일한 VLC 테이블로 구현하여 엔트로피 디코딩을 수행할 수 있다. 또한, 비디오 인코딩 장치에서 엔트로피 인코딩을 수행하기 위해 CABAC을 이용한 경우에, 엔트로피 디코딩부(210)는 이에 대응하여 CABAC을 이용한 엔트로피 디코딩을 수행할 수 있다.
엔트로피 디코딩부(210)에서 디코딩된 정보 중 예측 블록을 생성하기 위한 정보는 예측부(230)로 제공되고, 엔트로피 디코딩부(210)에서 엔트로피 디코딩이 수행된 레지듀얼 값, 즉 양자화된 변환 계수는 재정렬부(215)로 입력될 수 있다.
재정렬부(215)는 엔트로피 디코딩부(210)에서 엔트로피 디코딩된 비트스트림의 정보, 즉 양자화된 변환 계수를 인코딩 장치에서 재정렬한 방법을 기초로 재정렬할 수 있다.
재정렬부(215)는 1차원 벡터 형태로 표현된 계수들을 다시 2차원의 블록 형태의 계수로 복원하여 재정렬할 수 있다. 재정렬부(215)는 현재 블록(변환 블록)에 적용된 예측 모드와 변환 블록의 크기를 기반으로 계수에 대한 스캐닝을 수행하여 2 차원 블록 형태의 계수(양자화된 변환 계수) 배열을 생성할 수 있다.
역양자화부(220)는 인코딩 장치에서 제공된 양자화 파라미터와 재정렬된 블록의 계수값을 기초로 역양자화를 수행할 수 있다.
역변환부(225)는 비디오 인코딩 장치에서 수행된 양자화 결과에 대해, 인코딩 장치의 변환부가 수행한 DCT 및 DST에 대해 역DCT 및/또는 역DST를 수행할 수 있다.
역변환은 인코딩 장치에서 결정된 전송 단위 또는 영상의 분할 단위를 기초로 수행될 수 있다. 인코딩 장치의 변환부에서 DCT 및/또는 DST는 예측 방법, 현재 블록의 크기 및 예측 방향 등 복수의 정보에 따라 선택적으로 수행될 수 있고, 디코딩 장치의 역변환부(225)는 인코딩 장치의 변환부에서 수행된 변환 정보를 기초로 역변환을 수행할 수 있다.
예측부(230)는 엔트로피 디코딩부(210)에서 제공된 예측 블록 생성 관련 정보와 메모리(240)에서 제공된 이전에 디코딩된 블록 및/또는 픽처 정보를 기초로 예측 블록을 생성할 수 있다.
현재 PU에 대한 예측 모드가 인트라 예측(intra prediction) 모드인 경우에, 현재 픽처 내의 픽셀 정보를 기초로 예측 블록을 생성하는 인트라 예측을 수행할 수 있다.
현재 PU에 대한 예측 모드가 인터 예측(inter prediction) 모드인 경우에, 현재 픽처의 이전 픽처 또는 이후 픽처 중 적어도 하나의 픽처에 포함된 정보를 기초로 현재 PU에 대한 인터 예측을 수행할 수 있다. 이때, 비디오 인코딩 장치에서 제공된 현재 PU의 인터 예측에 필요한 움직임 정보, 예컨대 움직임 벡터, 참조 픽처 인덱스 등에 관한 정보는 인코딩 장치로부터 수신한 스킵 플래그, 머지 플래그 등을 확인하고 이에 대응하여 유도될 수 있다.
복원 블록은 예측부(230)에서 생성된 예측 블록과 역변환부(225)에서 제공된 레지듀얼 블록을 이용해 생성될 수 있다. 도 2에서는 가산기에서 예측 블록과 레지듀얼 블록이 합쳐져 복원 블록이 생성되는 것으로 설명하고 있다. 이때, 가산기를 복원 블록을 생성하는 별도의 유닛(복원 블록 생성부)로 볼 수 있다.
스킵 모드가 적용되는 경우에는 레지듀얼이 전송되지 않으며 예측 블록을 복원 블록으로 할 수 있다.
복원된 블록 및/또는 픽처는 필터부(235)로 제공될 수 있다. 필터부(235)는 복원된 블록 및/또는 픽처에 디블록킹 필터링, SAO(Sample Adaptive Offset) 및/또는 ALF 등을 적용할 수 있다.
메모리(240)는 복원된 픽처 또는 블록을 저장하여 참조 픽처 또는 참조 블록으로 사용할 수 있도록 할 수 있고 또한 복원된 픽처를 출력부로 제공할 수 있다.
도 3은 디코딩 장치에 처리되는 코딩된 영상에 대한 계층 구조를 도시한 도면이다.
코딩된 영상은 영상의 디코딩 처리 및 그 자체를 다루는 VCL(video coding layer, 비디오 코딩 계층)과 부호화된 정보를 전송하고 저장하는 하위 시스템의 사이에 있는 NAL(network abstraction layer, 네트워크 추상 계층)로 구분되어 있다.
NAL의 기본 단위인 NAL 유닛은 코딩된 영상을 소정의 규격에 따른 파일 포맷, RTP(Real-time Transport Protocol, TS(Transport Strean) 등과 같은 하위 시스템의 비트열에 매핑시키는 역할을 한다.
한편, 시퀀스와 픽처 등의 헤더에 해당하는 파라미터 세트(픽처 파라미터 세트, 시퀀스 파라미터 세트, 비디오 파라미터 세트) 및 영상의 디코딩 과정에 부가적으로 필요한 SEI(Supplemental Enhancement Information) 메세지도 영상에 대한 정보(슬라이스 데이터)와 분리되어 있다.
도시된 바와 같이, NAL 유닛은 NAL 헤더와 VCL에서 생성된 RBSP(Raw Byte Sequence Payload, 동영상 압축의 결과 데이터)의 두 부분으로 구성된다. NAL 헤더에는 해당 NAL 유닛의 타입에 대한 정보가 포함되어 있다.
NAL 유닛은 VCL에서 생성된 RBSP의 따라 VCL NAL 유닛과 non-VCL NAL 유닛으로 구분된다. VCL NAL 유닛은 영상에 대한 정보를 포함하고 있는 NAL 유닛을 의미하고, non-VCL NAL 유닛은 영상을 디코딩하기 위하여 필요한 정보(파라미터 세트 또는 SEI 메세지)를 포함하고 있는 NAL 유닛을 나타낸다.
VCL NAL 유닛은 해당 NAL 유닛이 포함하는 픽처의 성질 및 종류 등에 따라 여러 타입으로 나뉠 수 있다.
도 4는 랜덤 억세스가 가능한 픽처를 설명하기 위한 도면이다.
랜덤 억세스가 가능한 픽처, 즉 랜덤 억세스 포인트가 되는 IRAP(intra random access point) 픽처는 랜덤 억세스 시 비트스트림에서 디코딩 순서(decoding order) 상 첫 번째 픽처이며, I 슬라이스만을 포함한다.
도 4에는 픽처의 출력 순서(output order 또는 display order)와 디코딩 순서가 도시되어 있다. 도시된 바와 같이 픽처의 출력 순서와 디코딩 순서는 서로 다를 수 있다. 편의 상 픽처들은 소정의 그룹으로 구분하여 설명된다.
제1 그룹(Ⅰ)에 속하는 픽처들은 IRAP 픽처와 출력 순서 및 디코딩 순서 모두에서 선행하는 픽처를 나타내고, 제2 그룹(Ⅱ)에 속하는 픽처들은 IRAP 픽처보다 출력 순서는 선행하지만 디코딩 순서는 후행하는 픽처를 나타낸다. 마지막 제3 그룹(Ⅲ)의 픽처들은 IRAP 픽처보다 출력 순서 및 디코딩 순서 모두에서 후행한다.
제1 그룹(Ⅰ)의 픽처들은 IRAP 픽처와 무관하게 디코딩 되어 출력될 수 있다.
IRAP 픽처에 선행하여 출력되는 제2 그룹(Ⅱ)에 속하는 픽처들을 리딩 픽처(leading picture)라고 하며, 리딩 픽처들은 IRAP 픽처가 랜덤 억세스 포인트로 사용될 경우 디코딩 과정에서 문제될 수 있다. 이하에서 상세히 기술된다.
출력 및 디코딩 순서가 IRAP 픽처에 후행하는 제3 그룹(Ⅲ)에 속하는 픽처를 노말 픽처라고 한다. 노말 픽처는 리딩 픽처의 참조 픽처로 사용되지 않는다.
비트스트림에서 랜덤 억세스가 발생하는 랜덤 억세스 포인트는 IRAP 픽처가 되고, 제2 그룹(Ⅱ)의 첫 번째 퍽처가 출력되면서 랜덤 억세스가 시작 된다.
한편, IRAP 픽처는 IDR(instantaneous decoding refresh) 픽처와 CRA(clean random access) 픽처 중 어느 하나가 될 수 있다.
도 5는 IDR 픽처를 설명하기 위한 도면이다.
IDR 픽처는 픽처의 그룹(Group of Picture)이 닫힌(closed) 구조를 가질 때 랜덤 억세스 포인트가 되는 픽처이다. IDR 픽처는 IRAP 픽처이므로 I 슬라이스만을 포함하며, 비트스트림에서 디코딩 순서 상 첫 번째 픽처가 될 수도 있고, 비트스트림 중간에 올 수도 있다. IDR 픽처는 디코딩되면 DPB(decoded picture buffer)에 저장되어 있는 모든 참조 픽처들은“unused for reference”로 표시된다.
도 5에 도시되어 있는 막대는 픽처를 나타내고 화살표는 픽처가 다른 픽처를 참조 픽처로 이용할 수 있는지 여부에 대한 참조 관계를 나타낸다. 화살표 상에 표시되어 있는 x 마크는 해당 픽처(들)가 화살표가 가리키는 픽처를 참조할 수 없음을 나타낸다.
도시된 바와 같이, IDR 픽처의 POC는 32이고, POC가 25내지 31며 IDR 픽처에 선행하여 출력되는 픽처는 리딩 픽처들(510)이다. POC가 33보다 큰 픽처들은 노말 픽처(520)에 해당한다.
IDR 픽처에 선행하는 리딩 픽처들(510)은 IDR 픽처와 다른 리딩 픽처를 참조 픽처로 이용할 수 있지만, 리딩 픽처들(510)에 선행하는 과거 픽처(530)을 참조 픽처로 이용할 수 없다.
IDR 픽처에 후행하는 노말 픽처들(520)는 IDR 픽처와 리딩 픽처 및 다른 노말 픽처를 참조하여 디코딩 될 수 있다.
도 6은 CRA 픽처를 설명하기 위한 도면이다.
CRA 픽처는 픽처의 그룹(Group of Picture)이 열린(open) 구조를 가질 때 랜덤 억세스 포인트가 되는 픽처이다. CRA 픽처 역시 IRAP 픽처이므로 I 슬라이스만을 포함하며, 비트스트림에서 디코딩 순서 상 첫 번째 픽처가 될 수도 있고, 노멀 플레이를 위하여 비트스트림 중간에 올 수도 있다(appear).
CRA 픽처는 코딩된 픽처가 스플라이싱(splicing)되거나 비트스트림이 중간에 끊어지면 랜덤 억세스 포인트로서 비트스트림 중간에 존재할 수도 있다.
도 6에 도시되어 있는 막대는 픽처를 나타내고 화살표는 픽처가 다른 픽처를 참조 픽처로 이용할 수 있는지 여부에 대한 참조 관계를 나타낸다. 화살표 상에 표시되어 있는 x 마크는 해당 픽처 또는 픽처들이 화살표가 가리키는 픽처를 참조할 수 없음을 나타낸다.
CRA 픽처에 선행하는 리딩 픽처들(610)은 CRA 픽처와 다른 리딩 픽처, 및 리딩 픽처들(610)에 선행하는 과거 픽처(630) 모두를 참조 픽처로 이용할 수 있다.
반면, CRA 픽처에 후행하는 노말 픽처들(620)는 CRA 픽처와 다른 노말 픽처를 참조하여 디코딩 될 수 있지만, 리딩 픽처들(610)을 참조 픽처로 이용할 수 없다.
도 7은 리딩 픽처에 선행하는 픽처가 비가용한 경우를 설명하기 위한 도면이다.
리딩 픽처들(710)은 출력 순서가 CRA 픽처 보다 선행하기 때문에 CRA 픽처 보다 먼저 출력되지만, CRA 픽처보다 후행하여 디코딩 된다. 리딩 픽처들(710)은 선행하는 픽처들(730) 중 적어도 하나를 참조 할 수 있다.
한편, 도시된 바와 같이, 비트스트림이 중간에 잘리거나(cut) 비트스트림이 손실되거나(missing), 픽처의 스플라이싱이 발생하여 갑작스럽게 CRA 픽처에서 랜덤 억세스가 발생하면, 디코딩 순서가 CRA 픽처에 선행하는 선행 픽처들(730)은 가용하지 않을 수 있다(unavailable). 리딩 픽처들(710)의 참조 픽처가 될 수 있는 선행 픽처들(730)이 가용하지 않게 되면 가용하지 않는 픽처를 참조하는 리딩 픽처는 정상적으로 디코딩 되지 않을 수 있다.
리딩 픽처가 참조할 픽처가 가용하지 않는 경우는 리딩 픽처가 비트스트림 내 존재하지 않는 픽처를 참조 픽처로 포함하거나, 리딩 픽처가 참조할 픽처가 DPB에 존재하지 않는 경우 등을 포함할 수 있다.
본 발명의 일 실시예에 따른 영상 처리 장치는 상기와 같은 문제점에 해결하기 위하여 가용하지 않는 참조 픽처를 참조하는 리딩 픽처를 출력하지 않는다.
도 8은 본 발명의 일 실시예에 따른 영상 처리 장치의 제어 블록도이다. 도시된 바와 같이, 영상 처리 장치(800)는 비트스트림 수신부(810) 및 영상 처리부(820)를 포함한다.
영상 처리 장치(800)는 디코딩 과정을 수행하는 영상 처리부(820)를 포함하는 모듈 또는 장치로 구현될 수 있다. 영상 처리 장치(800)는 영상을 디코딩 하여 출력할 수 있는 텔레비전, 비디오 재생 장치, 다양한 단말 디바이스로 구현될 수 있다.
비트스트림 수신부(810)는 복수의 픽처를 포함하는 비트스트림을 수신한다.
비트스트림 수신부(810)로 수신된 비트스트림은 영상 처리부(820)에 의하여 디코딩 과정을 거친 후, 영상으로 출력된다.
비트스트림 수신부(810)는 입력되는 비트스트림을 파싱하여 픽처의 디코딩 과정에서 필요한 정보를 획득하는 파싱부를 포함할 수 있다.
영상 처리부(820)는 도 2의 구성들을 포함하는 디코딩 장치 또는 디코딩을 수행하는 디코딩 모듈로 구현될 수 있다. 본 실시예에 따른 영상 처리부(820)는 참조 픽처의 가용 여부에 따라 리딩 픽처를 출력할지 여부를 결정한다.
도 9는 영상 처리 장치(800)에 따른 영상의 처리 방법을 설명하기 위한 제어 흐름도이다.
우선, 영상 처리 장치(800)는 복수의 픽처를 포함하는 비트스트림을 수신한다(S901).
픽처는 랜덤 억세스 포인트가 되는 IDR 픽처 또는 CRA 픽처를 포함할 수 있다. 또한, 픽처는 랜덤 억세스 포인트 픽처보다 출력 순서는 선행하지만 디코딩 순서는 후행하는 리딩 픽처를 포함할 수 있다.
영상 처리부(820)는 리딩 픽처를 위한 적어도 하나의 참조 픽처가 가용하지 않으면, 리딩 픽처를 출력하지 않는다(S902).
리딩 픽처를 출력하지 않는 단계는 리딩 픽처를 비트스트림으로부터 제거하여 버리는 것을 포함할 수 있다. 버려진 리딩 픽처는 디코딩 과정(decoding process) 및 출력 과정(output process)에서 제외된다.
영상 처리부(820)는 가용하지 않는 참조 픽처를 참조하는 리딩 픽처가 존재하면, 비트스트림이 소정의 규격적합성(bitstream conformance)을 만족하는 것으로 판단하고, 이를 출력 영상에서 제외시키는 것을 기본 동작(default behavior)으로 수행한다.
디코딩이 불가능한 리딩 픽처에 대응하여 기본 동작이 수행되기 때문에 영상 처리 장치(800)에 발생할 수 있는 오동작 및 에러가 방지된다. 또한, 영상 처리 장치(800)는 갑작스럽게 랜덤 억세스가 발생한 비트스트림에 대하여 적절히 대응할 수 있다.
리딩 픽처를 디코딩 과정 및 출력 과정에서 제거시킨 후, 영상 처리부(820)는 제거된 리딩 픽처 이후의 픽처를 디코딩 한다(S903).
제거된 리딩 픽처 이후의 픽처는 비트스트림에서 손실된 참조 픽처 또는 존재하지 않는 참조 픽처 등과 무관하게 정상적으로 디코딩 가능한 픽처를 의미한다.
이 때, 영상 처리부(820)는 입력되는 비트스트림의 픽처 비트열을 유지하기 위하여, 즉 픽처를 저장하는 버퍼의 오버플로우나 언더 플로우를 방지하기 위하여 소정의 지연 시간만큼 시간을 지연시킨 후 후속 픽처를 디코딩 한다. 영상 처리부(820)는 코딩된 픽처를 저장하는 CPB(coded picture buffer) 및 디코딩된 픽처를 저장하는 DPB(decoded picture buffer)를 포함할 수 있다.
도 10은 본 발명의 일 실시예에 따라 리딩 픽처의 제거를 설명하기 위한 도면이다.
도시된 바와 같이, 리딩 픽처는 제1 리딩 픽처(1010)와 제2 리딩 픽처(1020)를 포함할 수 있다.
제1 그룹(Ⅰ)에 포함되어 있는 픽처들은 리딩 픽처가 참조할 수 없는 픽처를 포함할 수 있다. 제 1 그룹(Ⅰ)은 현재 디코딩 되어야 하는 픽처들, 즉 CRA 픽처 및 리딩 픽처(1010, 1020)와 전혀 무관한 픽처들을 포함할 수 있다.
제1 리딩 픽처(1010)는 가용하지 않는 참조 픽처를 참조하는 것과 같이 정상적으로 디코딩 되지 않는 픽처를 의미하며, 제2 리딩 픽처(1020)는 제1 리딩 픽처(1010)와 무관하게 정상 디코딩이 가능한 픽처를 의미한다.
리딩 픽처(1010, 1020)에 포함되어 있는 픽처 중 B0, B1 및 B2는 제1 리딩 픽처(1010)이고, B3 내지 B6은 제2 리딩 픽처(1020)이다.
본 실시예에 따를 경우, 디코딩 불가능한 제1 리딩 픽처(1010)는 디코딩 과정 및 출력 과정에서 제외된다. 제1 리딩 픽처(1010)는 비트스트림에서 제거 및 버려질 수 있다.
영상 처리부(820)는 디코딩 과정 및 출력 과정에서 제외된 제1 리딩 픽처(1010) 이후의 제2 리딩 픽처(1020)를 디코딩하여 출력한다. 제2 리딩 픽처(1020)가 출력되면서 랜덤 억세스가 시작된다.
이 때, 영상 처리부(820)는 제거된 리딩 픽처(1010)에 대한 비트스트림 타이밍을 고려하여 제2 리딩 픽처(1020)의 디코딩 시간을 지연시킬 수 있다.
도 11은 본 발명의 다른 실시예에 따라 리딩 픽처의 제거를 설명하기 위한 도면이다.
도 11을 참조하면, 리딩 픽처는 제1 리딩 픽처(1110)와 제2 리딩 픽처(1120)를 포함할 수 있다.
상술한 바와 같이, 제1 리딩 픽처(1110)는 가용하지 않는 참조 픽처를 참조하는 것과 같이 정상적으로 디코딩 되지 않는 픽처를 의미하며, 제2 리딩 픽처(1120)는 제1 리딩 픽처(1110)와 무관하게 정상 디코딩이 가능한 픽처를 의미한다.
리딩 픽처(1110, 1120)에 포함되어 있는 픽처 중 B0, B1 및 B2는 제1 리딩 픽처(1110)이고, B3 내지 B6은 제2 리딩 픽처(1120)이다.
본 실시예에 따르면, 영상 처리부(820)는 디코딩 불가능한 제1 리딩 픽처(1110)뿐만 아니라 정상적으로 디코딩 가능한 제2 리딩 픽처(1120) 역시 디코딩 과정 및 출력 과정에서 제외 시킬 수 있다. 영상 처리부(820)는 제1 리딩 픽처(1110) 및 제2 리딩 픽처(1120)를 비트스트림에서 제거하고 버릴 수 있다.
영상 처리부(820)는 디코딩 과정 및 출력 과정에서 제외된 제1 리딩 픽처(1110) 및 제2 리딩 픽처(1120) 이후의 픽처, 즉 제3 그룹(Ⅲ)의 픽처들을 디코딩하여 출력한다.
이 때, 영상 처리부(820)는 제거된 리딩 픽처(1110, 1120)에 대한 버퍼의 오버플로우나 언더 플로우를 방지하기 위하여 소정의 지연 시간만큼 시간을 지연시킨 후 후속 픽처를 디코딩 할 수 있다.
랜덤 억세스 포인트가 되는 CRA 픽처가 디코딩 된 후 지연 시간이 경과하면 제3 그룹(Ⅲ)의 픽처들이 디코딩되고, 디코딩된 CRA 픽처와 제3 그룹(Ⅲ)에 속하는 픽처들이 연속적으로 디스플레이 된다.
도 12는 본 발명의 또 다른 실시예에 따라 리딩 픽처의 제거를 설명하기 위한 도면이다.
도 12에 도시된 바와 같이, 리딩 픽처는 가용하지 않는 참조 픽처를 참조하는 제1 리딩 픽처(1210)만을 포함할 수 있다. 즉, CRA 픽처 이후 제2 그룹(Ⅱ)의 픽처 B0 내지 B6은 가용하지 않는 픽처를 참조하는 제1 리딩 픽처(1210)에 해당한다.
영상 처리부(820)는 디코딩 불가능한 제1 리딩 픽처(1210) 모두를 디코딩 과정 및 출력 과정에서 제외 시킬 수 있다. 제1 리딩 픽처(1210)는 비트스트림에서 제거 및 버려질 수 있다.
영상 처리부(820)는 디코딩 과정 및 출력 과정에서 제외된 제1 리딩 픽처(1210) 이후의 제3 그룹(Ⅲ)의 픽처들을 디코딩하여 출력한다.
영상 처리부(820)는 랜덤 억세스 포인트가 되는 CRA 픽처가 디코딩 된 후 지연 시간이 경과하면 제3 그룹(Ⅲ)의 픽처들을 디코딩하고, 디코딩된 CRA 픽처와 제3 그룹(Ⅲ)의 픽처들을 연속적으로 출력한다.
도 13은 본 발명의 또 다른 실시예에 따른 영상의 처리 방법을 설명하기 위한 제어 흐름도이다.
복수의 픽처를 포함하는 비트스트림이 수신된다(S1301).
픽처는 랜덤 억세스 포인트가 되는 픽처들, 랜덤 억세스 포인트 픽처보다 출력 순서가 선행하고 디코딩 순서는 후행하는 리딩 픽처 및 랜덤 억세스 포인트 픽처보다 출력 순서 및 디코딩 순서가 후행하는 노말 픽처를 포함할 수 있다. 리딩 픽처는 디코딩 불가능한 제1 리딩 픽처와 디코딩 가능한 제2 리딩 픽처 중 적어도 하나를 포함할 수 있다. 제1 리딩 픽처는 비트스트림에서 존재하지 않는 픽처 또는 가용하지 않는 픽처를 참조 할 수 있다.
영상 처리부는 비트스트림에 제1 리딩 픽처가 존재하면, 제1 리딩 픽처를 위한 비가용 참조 픽처를 생성한다(S1302).
제1 리딩 픽처는 출력 되지 않고 다른 픽처의 디코딩 과정에 영향을 주지 않지만, 영상 처리부는 제1 리딩 픽처를 위한 비 가용 참조 픽처, 즉 가상의 참조 픽처를 생성하여 마치 제1 리딩 픽처가 디코딩 되는 것과 같이 동작한다.
비 가용 참조 픽처의 샘플값은 픽처가 가질 수 있는 샘플값의 중간값으로 생성될 수 있다.
영상 처리부는 비 가용 참조 픽처가 출력되지 않도록 픽처의 출력에 대한 플래그 신호를 0으로 설정하고, 제1 리딩 픽처 역시 출력되지 않도록 처리한다(S1303).
디코딩 불가능한 제1 리딩 픽처의 처리 후 영상 처리부는 정상적으로 디코딩 될 수 있는 제2 리딩 픽처의 디코딩 과정을 수행한다.
본 발명의 또 다른 실시예에 따르면, 영상 처리 장치는 리딩 픽처에 대한 플래그 정보를 수신하고, 수신한 플래그 정보에 기초하여 리딩 픽처를 처리할 수 있다. 표 1은 리딩 픽처에 대한 플래그 정보를 포함하고 있는 신택스를 예시적으로 나타낸 것이다
표 1
Figure PCTKR2013003456-appb-T000001
표 1의 broken_link_leading_pics_enable_flag가 1이면, 리딩 픽처를 위한 적어도 하나의 참조 픽처가 가용하지 않음을 나타내고, broken_link_leading_pics_enable_flag가 0이면 리딩 픽처는 가용하지 않은 참조 픽처를 포함하지 않는 것을 나타낸다. 예를 들어, 참조 픽처가 손실되면 broken_link_leading_pics_enable_flag는 1이 된다.
영상 처리부는 broken_link_leading_pics_enable_flag가 1이면, 가용하지 않은 참조 픽처를 포함하는 리딩 픽처를 디코딩 과정 및 출력 과정에서 제거할 수 있다.
리딩 픽처는 정상적으로 디코딩 될 수 없는 제1 리딩 픽처와 정상적으로 디코딩 가능한 제2 리딩 픽처를 포함할 수 있다.
영상 처리부는 제1 리딩 픽처만 디코딩 및 출력 과정에서 제거시킬 수도 있고, 리딩 픽처가 제1 리딩 픽처인지 또는 제2 리딩 픽처인지 무관하게 모든 리딩 픽처를 디코딩 및 출력 과정에서 제거할 수도 있다.
또는, 영상 처리부는 참조 픽처가 가용하지 않은 제1 리딩 픽처를 위하여 비 가용 참조 픽처를 생성할 수도 있다. 이 경우, 생성된 비 가용 참조 픽처와 제1 리딩 픽처는 출력되지 않는다.
정리하면, 영상 처리부는 리딩 픽처를 위한 적어도 하나의 참조 픽처가 가용하지 않음을 나타내는 플래그 정보를 수신하고, 이에 대응하여 도 10 내지 도 13에 설명되어 있는 어느 하나의 동작을 수행할 수 있다.
한편, 영상 처리 장치는 broken_link_leading_pics_enable_flag와 같은 플래그 정보를 수신할 수도 있지만 비트스트림에 포함되어 있는 픽처의 성질을 파악하여 broken_link_leading_pics_enable_flag를 설정할 수 있다.
영상 처리부는 상위 시스템 레벨에서 설정된 플래그 정보에 따라 리딩 픽처를 디코딩 및 출력 과정에서 제거할 수 있다.
또 다른 실시예에 따르면, 영상 처리부는 표 1의 플래그 정보를 수신하면 수신된 비트스트림이 소정의 규격적합성을 만족하지 않은 것으로 판단하고, 비트스트림이 규격 적합성을 만족하지 못한 경우에 대응하는 후속 동작을 수행할 수 있다.
예를 들어, 영상 처리부는 영상의 디코딩을 중단하고, 디코딩 과정에서 발생한 에러를 출력할 수 있다. 에러 정보는 영상 처리부의 상위 시스템 레벨, 예를 들어 어플리케이션 또는 비디오 플레이어 레벨에 보고될 수 있다. 영상 처리부는 상위 시스템 레벨부터 에러에 대한 후속 동작을 지시 받을 수도 있고, 디폴트로 설정되어 있는 동작을 수행할 수 있다.
영상 처리부는 에러를 출력한 뒤, 리딩 픽처 이후의 디코딩 가능한 픽처들에 대한 디코딩을 수행할 수 있다.
또, 다른 실시예에 따르면, 영상 처리 장치는 수신된 리딩 픽처를 위한 적어도 하나의 참조 픽처가 가용하지 않으면, 비트스트림이 소정의 규격 적합성을 따르지 않은 것(non-conformance)으로 판단할 수 있다.
다시 말해, 본 실시예에 따른 영상 처리부는 정상적으로 디코딩할 수 없는 픽처가 검색되면, 리딩 픽처에 대한 플래그 정보를 수신하지 않아도 비트스트림이 규격 적합성을 따르지 않는 것으로 판단하고, 비트스트림이 규격 적합성을 만족하지 못한 경우에 대한 후속 동작을 수행할 수 있다.
영상 처리부는 디코딩 과정을 중단하고, 디코딩 과정에서 발생한 에러를 출력할 수 있다. 에러 정보는 영상 처리부의 상위 시스템 레벨, 예를 들어 어플리케이션 또는 비디오 플레이어 레벨에 보고될 수 있다. 영상 처리부는 상위 시스템 레벨부터 에러에 대한 후속 동작을 지시 받을 수도 있고, 디폴트로 설정되어 있는 동작을 수행할 수 있다.
영상 처리부는 에러를 출력한 뒤, 리딩 픽처 이후의 디코딩 가능한 픽처들에 대한 디코딩을 수행할 수 있다.
상술한 예시적인 시스템에서, 방법들은 일련의 단계 또는 블록으로써 순서도를 기초로 설명되고 있지만, 본 발명은 단계들의 순서에 한정되는 것은 아니며, 어떤 단계는 상술한 바와 다른 단계와 다른 순서로 또는 동시에 발생할 수 있다. 또한, 상술한 실시예들은 다양한 양태의 예시들을 포함할 수 있으므로 각 실시예의 조합 역시 본 발명의 일 실시예로서 이해되어야 할 것이다. 따라서, 본 발명은 이하의 특허청구범위 내에 속하는 모든 다른 교체, 수정 및 변경을 포함한다고 할 것이다.

Claims (15)

  1. 복수의 픽처를 포함하는 비트스트림을 수신하는 단계와;
    랜덤 억세스 포인트 픽처보다 출력 순서가 선행하고 디코딩 순서는 후행하는 리딩 픽처를 위한 적어도 하나의 참조 픽처가 가용하지 않으면, 상기 리딩 픽처를 출력하지 않는 단계를 포함하는 것을 특징으로 하는 영상 처리 방법.
  2. 제1항에 있어서,
    상기 리딩 픽처를 출력하지 않는 단계는 상기 리딩 픽처를 상기 비트스트림으로부터 제거하여 버리는 단계(remove from the bitstream and discard)를 포함하고,
    상기 제거된 리딩 픽처 이후의 픽처를 디코딩 하는 단계를 더 포함하는 것을 특징으로 하는 영상 처리 방법.
  3. 제1항에 있어서,
    상기 리딩 픽처는 디코딩 과정 및 출력 과정에서 제외되는 것을 특징으로 하는 영상 처리 방법.
  4. 제2항에 있어서,
    상기 제거된 리딩 픽처 이후의 픽처는 소정의 지연 시간만큼 지연된 후 디코딩 되는 것을 특징으로 하는 영상 처리 방법.
  5. 상기 리딩 픽처는 디코딩 불가능한 제1 리딩 픽처와 디코딩 가능한 제2 리딩 픽처를 포함하고,
    상기 리딩 픽처를 상기 비트스트림으로부터 제거하여 버리는 단계는 상기 제1 리딩 픽처를 디코딩 과정 및 출력 과정에서 제외시키는 것을 특징으로 하는 영상 처리 방법.
  6. 제2항에 있어서,
    상기 리딩 픽처는 디코딩 불가능한 제1 리딩 픽처와 디코딩 가능한 제2 리딩 픽처를 포함하고,
    상기 리딩 픽처를 상기 비트스트림으로부터 제거하여 버리는 단계는 상기 제1 리딩 픽처 및 상기 제2 리딩 픽처를 상기 비트스트림으로부터 제거하여 버리는 것을 특징으로 하는 영상 처리 방법.
  7. 제2항에 있어서,
    상기 리딩 픽처는 디코딩 불가능한 제1 리딩 픽처를 포함하고,
    상기 리딩 픽처를 상기 비트스트림으로부터 제거하여 버리는 단계는 상기 제1 리딩 픽처를 상기 비트스트림으로부터 제거하여 버리는 것을 특징으로 하는 영상 처리 방법.
  8. 제1항에 있어서,
    상기 리딩 픽처는 디코딩 불가능한 제1 리딩 픽처와 디코딩 가능한 제2 리딩 픽처를 포함하고,
    상기 제1 리딩 픽처를 위한 비가용 참조 픽처를 생성하는 단계와;
    상기 비가용 참조 픽처의 출력을 차단하는 플래그 신호를 생성하는 단계를 더 포함하는 것을 특징으로 하는 하는 영상 처리 방법.
  9. 제8항에 있어서,
    상기 제2 리딩 픽처를 디코딩 하는 단계를 더 포함하는 것을 특징으로 하는 영상 처리 방법.
  10. 제1항에 있어서,
    상기 리딩 픽처는 상기 비트스트림 내 존재하지 않는 픽처를 참조 픽처로 포함하는 것을 특징으로 하는 영상 처리 방법.
  11. 제1항에 있어서,
    상기 랜덤 억세스 포인트 픽처는 CRA(clean random access) 픽처인 것을 특징으로 하는 영상 처리 방법.
  12. 제1항에 있어서,
    상기 리딩 픽처를 위한 적어도 하나의 참조 픽처가 가용하지 않음을 지시하는 플래그 정보를 수신하는 단계를 더 포함하는 것을 특징으로 하는 영상 처리 방법.
  13. 제12항에 있어서,
    상기 플래그 정보를 통하여 상기 리딩 픽처를 위한 적어도 하나의 참조 픽처가 가용하지 않는 것으로 판단되면,
    상기 비트스트림의 에러 정보를 출력하는 단계와;
    상기 리딩 픽처 이후의 픽처를 디코딩 하는 단계를 더 포함하는 것을 특징으로 하는 영상 처리 방법.
  14. 제1항에 있어서,
    상기 리딩 픽처를 위한 적어도 하나의 참조 픽처가 가용하지 않으면, 상기 비트스트림이 소정의 규격적합성을 따르지 않는 것(non-conformance)으로 판단하는 것을 특징으로 하는 영상 처리 방법.
  15. 제14항에 있어서,
    상기 비트스트림의 에러정보를 출력하는 단계와;
    상기 리딩 픽처 이후의 픽처를 디코딩 하는 단계를 더 포함하는 것을 특징으로 하는 영상 처리 방법.
PCT/KR2013/003456 2012-04-23 2013-04-23 비디오 인코딩 방법, 비디오 디코딩 방법 및 이를 이용하는 장치 WO2013162249A1 (ko)

Priority Applications (14)

Application Number Priority Date Filing Date Title
KR1020227023481A KR102574868B1 (ko) 2012-04-23 2013-04-23 비디오 인코딩 방법, 비디오 디코딩 방법 및 이를 이용하는 장치
CN201380003980.4A CN103959792B (zh) 2012-04-23 2013-04-23 视频编码方法、视频解码方法以及实现该方法的装置
KR1020217010983A KR102309609B1 (ko) 2012-04-23 2013-04-23 비디오 인코딩 방법, 비디오 디코딩 방법 및 이를 이용하는 장치
EP13782395.1A EP2760203A4 (en) 2012-04-23 2013-04-23 VIDEO ENCODING METHOD, VIDEO DECODING METHOD, AND APPARATUS EMPLOYING THEM
KR1020147008969A KR102160958B1 (ko) 2012-04-23 2013-04-23 비디오 인코딩 방법, 비디오 디코딩 방법 및 이를 이용하는 장치
KR1020217031400A KR102420153B1 (ko) 2012-04-23 2013-04-23 비디오 인코딩 방법, 비디오 디코딩 방법 및 이를 이용하는 장치
US14/354,937 US9565432B2 (en) 2012-04-23 2013-04-23 Video-encoding method, video-decoding method, and apparatus implementing same
KR1020207027364A KR102241998B1 (ko) 2012-04-23 2013-04-23 비디오 인코딩 방법, 비디오 디코딩 방법 및 이를 이용하는 장치
US15/387,727 US9912960B2 (en) 2012-04-23 2016-12-22 Video-encoding method, video-decoding method, and apparatus implementing same
US15/892,650 US10158872B2 (en) 2012-04-23 2018-02-09 Video-encoding method, video-decoding method, and apparatus implementing same
US16/222,383 US10511850B2 (en) 2012-04-23 2018-12-17 Video-encoding method, video-decoding method, and apparatus implementing same
US16/677,192 US10869052B2 (en) 2012-04-23 2019-11-07 Video-encoding method, video-decoding method, and apparatus implementing same
US17/098,886 US11330281B2 (en) 2012-04-23 2020-11-16 Video-encoding method, video-decoding method, and apparatus implementing same
US17/725,121 US11917178B2 (en) 2012-04-23 2022-04-20 Video-encoding method, video-decoding method, and apparatus implementing same

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201261636745P 2012-04-23 2012-04-23
US61/636,745 2012-04-23

Related Child Applications (2)

Application Number Title Priority Date Filing Date
US14/354,937 A-371-Of-International US9565432B2 (en) 2012-04-23 2013-04-23 Video-encoding method, video-decoding method, and apparatus implementing same
US15/387,727 Continuation US9912960B2 (en) 2012-04-23 2016-12-22 Video-encoding method, video-decoding method, and apparatus implementing same

Publications (1)

Publication Number Publication Date
WO2013162249A1 true WO2013162249A1 (ko) 2013-10-31

Family

ID=49483473

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2013/003456 WO2013162249A1 (ko) 2012-04-23 2013-04-23 비디오 인코딩 방법, 비디오 디코딩 방법 및 이를 이용하는 장치

Country Status (5)

Country Link
US (7) US9565432B2 (ko)
EP (1) EP2760203A4 (ko)
KR (5) KR102160958B1 (ko)
CN (3) CN107257472B (ko)
WO (1) WO2013162249A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3012935A1 (fr) * 2014-05-20 2015-05-08 Thomson Licensing Procede et dispositif de codage d'images video, procede et dispositif de decodage d'un flux de donnees, programme d'ordinateur et support de stockage correspondants

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9565432B2 (en) * 2012-04-23 2017-02-07 Lg Electronics Inc. Video-encoding method, video-decoding method, and apparatus implementing same
KR102135957B1 (ko) * 2012-07-06 2020-07-21 삼성전자주식회사 랜덤 억세스를 위한 멀티 레이어 비디오 부호화 방법 및 그 장치, 랜덤 억세스를 위한 멀티 레이어 비디오 복호화 방법 및 그 장치
US10264272B2 (en) * 2013-10-15 2019-04-16 Qualcomm Incorporated Device and method for scalable coding of video information
US10116576B2 (en) * 2015-10-19 2018-10-30 Samsung Electronics Co., Ltd. Methods and apparatus for random access of HEVC bitstream for MMT
US10384432B2 (en) * 2016-02-19 2019-08-20 Palo Alto Research Center Incorporated Hierarchical laminates fabricated from micro-scale, digitally patterned films
KR20210134029A (ko) * 2019-03-11 2021-11-08 텔레호낙티에볼라게트 엘엠 에릭슨(피유비엘) 비디오 코딩을 위한 복구 포인트 프로세스의 방법들 및 관련 장치
EP4011068A4 (en) * 2019-08-06 2023-08-09 OP Solutions, LLC IMPLICIT SIGNALING OF ADAPTIVE RESOLUTION MANAGEMENT BASED ON FRAME TYPE
CN110662071B (zh) * 2019-09-27 2023-10-24 腾讯科技(深圳)有限公司 视频解码方法和装置、存储介质及电子装置
WO2021091252A1 (ko) * 2019-11-05 2021-05-14 엘지전자 주식회사 영상/비디오 코딩을 위한 영상 정보 처리 방법 및 장치

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040066854A1 (en) * 2002-07-16 2004-04-08 Hannuksela Miska M. Method for random access and gradual picture refresh in video coding
US20070076801A1 (en) * 2002-07-11 2007-04-05 Lim Chong S Picture encoding method and picture decoding method
US20080192830A1 (en) * 2007-02-14 2008-08-14 Samsung Electronics Co., Ltd. Method of encoding and decoding motion picture frames
US20090135917A1 (en) * 2002-04-16 2009-05-28 Shinya Kadono Picture coding method and picture decoding method
WO2011129573A2 (ko) * 2010-04-16 2011-10-20 에스케이텔레콤 주식회사 인터 예측 방법 및 그 인터 예측 방법을 이용한 동영상 부호화/복호화 방법

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004075554A1 (en) * 2003-02-18 2004-09-02 Nokia Corporation Picture decoding method
US8875199B2 (en) * 2006-11-13 2014-10-28 Cisco Technology, Inc. Indicating picture usefulness for playback optimization
US8121189B2 (en) 2007-09-20 2012-02-21 Microsoft Corporation Video decoding using created reference pictures
RU2011135321A (ru) 2009-01-28 2013-03-10 Нокиа Корпорейшн Способ и устройство для кодирования и декодирования видеосигналов
US9264717B2 (en) * 2011-10-31 2016-02-16 Qualcomm Incorporated Random access with advanced decoded picture buffer (DPB) management in video coding
US9532055B2 (en) * 2012-04-16 2016-12-27 Microsoft Technology Licensing, Llc Constraints and unit types to simplify video random access
US9565432B2 (en) * 2012-04-23 2017-02-07 Lg Electronics Inc. Video-encoding method, video-decoding method, and apparatus implementing same

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090135917A1 (en) * 2002-04-16 2009-05-28 Shinya Kadono Picture coding method and picture decoding method
US20070076801A1 (en) * 2002-07-11 2007-04-05 Lim Chong S Picture encoding method and picture decoding method
US20040066854A1 (en) * 2002-07-16 2004-04-08 Hannuksela Miska M. Method for random access and gradual picture refresh in video coding
US20080192830A1 (en) * 2007-02-14 2008-08-14 Samsung Electronics Co., Ltd. Method of encoding and decoding motion picture frames
WO2011129573A2 (ko) * 2010-04-16 2011-10-20 에스케이텔레콤 주식회사 인터 예측 방법 및 그 인터 예측 방법을 이용한 동영상 부호화/복호화 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3012935A1 (fr) * 2014-05-20 2015-05-08 Thomson Licensing Procede et dispositif de codage d'images video, procede et dispositif de decodage d'un flux de donnees, programme d'ordinateur et support de stockage correspondants

Also Published As

Publication number Publication date
US9565432B2 (en) 2017-02-07
KR102241998B1 (ko) 2021-04-19
US20220248042A1 (en) 2022-08-04
US10869052B2 (en) 2020-12-15
US20190124344A1 (en) 2019-04-25
CN103959792A (zh) 2014-07-30
KR20210124516A (ko) 2021-10-14
KR102160958B1 (ko) 2020-09-29
US20200077108A1 (en) 2020-03-05
CN103959792B (zh) 2017-06-23
US10511850B2 (en) 2019-12-17
KR102574868B1 (ko) 2023-09-06
US20170105016A1 (en) 2017-04-13
US9912960B2 (en) 2018-03-06
KR102309609B1 (ko) 2021-10-06
US11330281B2 (en) 2022-05-10
CN107257472B (zh) 2020-05-12
CN107197312A (zh) 2017-09-22
US20150036754A1 (en) 2015-02-05
EP2760203A4 (en) 2015-05-27
CN107257472A (zh) 2017-10-17
US11917178B2 (en) 2024-02-27
EP2760203A1 (en) 2014-07-30
US20180167629A1 (en) 2018-06-14
US20210067795A1 (en) 2021-03-04
KR20210043026A (ko) 2021-04-20
KR20150013112A (ko) 2015-02-04
US10158872B2 (en) 2018-12-18
KR20220104266A (ko) 2022-07-26
KR20200113016A (ko) 2020-10-05
KR102420153B1 (ko) 2022-07-12
CN107197312B (zh) 2020-09-01

Similar Documents

Publication Publication Date Title
WO2013162249A1 (ko) 비디오 인코딩 방법, 비디오 디코딩 방법 및 이를 이용하는 장치
WO2014042460A1 (ko) 영상 부호화/복호화 방법 및 장치
WO2020071830A1 (ko) 히스토리 기반 움직임 정보를 이용한 영상 코딩 방법 및 그 장치
WO2013157826A1 (ko) 영상 정보 디코딩 방법, 영상 디코딩 방법 및 이를 이용하는 장치
WO2014092407A1 (ko) 영상의 디코딩 방법 및 이를 이용하는 장치
WO2015009036A1 (ko) 시간적 서브 레이어 정보에 기반한 인터 레이어 예측 방법 및 장치
WO2014084656A1 (ko) 복수의 레이어를 지원하는 영상 부호화/복호화 방법 및 장치
WO2014038905A2 (ko) 영상 복호화 방법 및 이를 이용하는 장치
WO2021096057A1 (ko) 비디오 또는 영상 코딩 시스템에서의 엔트리 포인트 관련 정보에 기반한 영상 코딩 방법
WO2014007515A1 (ko) 영상 정보 코딩 방법 및 이를 이용하는 장치
WO2021040319A1 (ko) 비디오/영상 코딩 시스템에서 라이스 파라미터 도출 방법 및 장치
WO2014051372A1 (ko) 영상 복호화 방법 및 이를 이용하는 장치
WO2021177791A1 (ko) 혼성 nal 유닛 타입에 기반하는 영상 부호화/복호화 방법, 장치 및 비트스트림을 전송하는 방법
WO2021132964A1 (ko) Nal 유닛 관련 정보 기반 영상 또는 비디오 코딩
WO2014007514A1 (ko) 영상 디코딩 방법 및 이를 이용하는 장치
WO2022060113A1 (ko) 미디어 파일 처리 방법 및 그 장치
WO2021246791A1 (ko) 영상/비디오 코딩 시스템에서 상위 레벨 신택스를 처리하는 방법 및 장치
WO2017078450A1 (ko) 영상 코딩 시스템에서 영상 디코딩 방법 및 장치
WO2020060259A1 (ko) 영상 코딩 시스템에서 블록 파티셔닝을 사용하는 영상 디코딩 방법 및 그 장치
WO2020071672A1 (ko) 움직임 벡터를 압축하는 방법 및 그 장치
WO2023195819A1 (ko) 적응적 슬라이스 스캔 방식에 기반한 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장하는 기록 매체
WO2017069591A1 (ko) 영상 코딩 시스템에서 영상 필터링 방법 및 장치
WO2023022578A1 (ko) 영상 신호 처리 방법 및 장치
WO2021201617A1 (ko) 레이어간 정렬된 서브픽처 정보에 기반하는 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장하는 기록 매체
WO2021091260A1 (ko) 크로마 양자화 파라미터 오프셋 정보 기반 영상 또는 비디오 코딩

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13782395

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 20147008969

Country of ref document: KR

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 14354937

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE