WO2013162283A1 - 비디오 신호 처리 방법 및 장치 - Google Patents

비디오 신호 처리 방법 및 장치 Download PDF

Info

Publication number
WO2013162283A1
WO2013162283A1 PCT/KR2013/003513 KR2013003513W WO2013162283A1 WO 2013162283 A1 WO2013162283 A1 WO 2013162283A1 KR 2013003513 W KR2013003513 W KR 2013003513W WO 2013162283 A1 WO2013162283 A1 WO 2013162283A1
Authority
WO
WIPO (PCT)
Prior art keywords
codeword
binarized
quantized transform
transform coefficient
absolute value
Prior art date
Application number
PCT/KR2013/003513
Other languages
English (en)
French (fr)
Inventor
허진
정지욱
예세훈
구문모
김태섭
성재원
손은용
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Publication of WO2013162283A1 publication Critical patent/WO2013162283A1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Definitions

  • the present invention relates to a method and apparatus for coding a video signal.
  • Compression coding refers to a series of signal processing techniques that transmit digitized information through a communication line or store the data in a form suitable for a storage medium.
  • the object of compression encoding includes objects such as voice, video, text, and the like.
  • a technique of performing compression encoding on an image is called video image compression.
  • a general feature of a multiview video image is that it has spatial redundancy, temporal redundancy and inter-view redundancy.
  • An object of the present invention is to improve the coding efficiency of a video signal.
  • encoding and decoding are performed in consideration of characteristics of residual data of a video signal.
  • the codeword is modified so that quantized transform coefficients frequently coded are assigned small bits.
  • FIG. 1 is a schematic block diagram of a video decoder device according to an embodiment to which the present application is applied.
  • FIG. 2 is a diagram illustrating an encoding sequence of a 4 ⁇ 4 block according to an embodiment to which the present application is applied.
  • FIG. 3 is a flowchart illustrating an encoding step of quantized residual data according to an embodiment to which the present application is applied.
  • FIG. 4 illustrates an example of a second binarization codeword as an embodiment to which the present application is applied.
  • FIG. 5 illustrates an example of a first binarization codeword as an embodiment to which the present application is applied.
  • FIG. 6 is a flowchart illustrating a decoding method using a binarized codeword as an embodiment to which the present application is applied.
  • the present invention obtains binarization mode information and quantized transform coefficients from a bitstream, determines order information using at least one of the binarization mode information and the quantized transform coefficients, and uses a second binarization codeword using the order information. Is determined, the second binarization codeword is determined by modifying a first binarization codeword, and the first binarization codeword is quantized using the order information. Determines the codewords that correspond to the transform coefficients.
  • Techniques for compression encoding or decoding multi-view video signal data take into account spatial redundancy, temporal redundancy, and redundancy existing between views.
  • a multiview image a multiview texture image photographed at two or more viewpoints and a multiview depth image corresponding thereto must be coded in order to realize a 3D image.
  • compression coding may be performed in consideration of spatial redundancy, temporal redundancy, or inter-view redundancy.
  • Each sample value of the depth image represents distance information between the camera and the corresponding pixel.
  • terms such as depth information, depth data, depth picture, depth sequence, depth coding, and depth bitstream may be flexibly interpreted as information related to depth within the present specification.
  • Coding can sometimes be interpreted as encoding or decoding, and information is a term that includes values, parameters, coefficients, elements, etc. It can be interpreted as meaning.
  • the term 'picture' or 'picture' generally refers to a unit representing an image in a specific time zone, and 'slice' or 'frame' refers to a picture in coding to an actual video signal. Although it is a unit constituting part of, it can be used interchangeably with each other if necessary.
  • 'Pixel', 'pixel' or 'pel' refers to the smallest unit that constitutes an image.
  • the term 'sample' may be used as a term indicating a value of a specific pixel.
  • Samples can be divided into Luma and Chroma components, but are generally used as terms that include both.
  • the color difference component represents a difference between predetermined colors and is generally composed of Cb and Cr.
  • the term 'unit' is used to mean a basic unit of image processing or a specific position of an image. In some cases, the term 'unit' is used interchangeably with terms such as 'block' or 'area'. Can be. However, in a general case, a block is used as a term indicating a set of samples or transform coefficients composed of M columns and N rows.
  • An encoding apparatus includes a transformer, a quantizer, an inverse quantizer, an inverse transformer, a filter, a predictor, and / or an entropy coding unit.
  • the transform unit converts pixel values of the received video signal to obtain transform coefficient values.
  • a discrete cosine transform (DCT) or a wavelet transform may be used.
  • the converting unit divides the input image signal into units having a predetermined size to perform the conversion.
  • the quantization unit quantizes the transform coefficient values output from the transform unit.
  • the filtering unit performs a filtering operation to improve the image quality.
  • the filter used in the filtering unit may include, for example, a deblocking filter and / or an adaptive loop filter.
  • the frame storage unit outputs the restored image or stores the restored image for use as a reference image.
  • a method of predicting an image by using an already coded region and adding a residual value between the original image and the predicted image to a reconstructed image is used instead of coding the image signal as it is.
  • a method of predicting an image intra prediction, inter prediction, and the like may be used, and thus the prediction unit may include an intra predictor and an inter predictor.
  • the intra prediction unit performs intra prediction from the reconstructed regions in the current image and transmits the intra encoding information to the entropy coding unit.
  • the inter prediction unit predicts the current image by using at least one reference image stored in the frame storage unit and performs inter-screen motion compensation.
  • the entropy coding unit entropy codes the quantized transform coefficients, inter picture encoding information, intra picture encoding information, and reference region information input from the inter prediction unit to generate a video signal bitstream.
  • a variable length coding (VLC) method and arithmetic coding may be used.
  • the operation of the video signal decoding apparatus may correspond to the operation of the encoder and perform the reverse process.
  • FIG. 1 is a schematic block diagram of a video decoder according to an embodiment to which the present invention is applied.
  • the decoding apparatus includes a parser 100, an entropy decoder 200, an inverse quantizer / inverse transformer 300, a filter 600, an intra predictor 400, and an inter predictor ( 500, the frame storage unit 700 and the like.
  • the parser 100 performs parsing on a NAL basis to decode the input bitstream.
  • the input bitstream may include a camera parameter.
  • the camera parameters may include unique camera parameters and non-unique camera parameters.
  • the unique camera parameters may include a focal length, an aspect ratio, a pub, and the like.
  • the non-unique camera parameters may include camera position information in a world coordinate system. This can be.
  • the entropy decoding unit 200 is an inverse process of entropy coding, and entropy decodes a video signal bitstream to extract a coding type, quantized transform coefficients for each region, and coding information for predicting a texture picture and a depth picture. have.
  • the inverse quantization / inverse transform unit 300 may apply a quantization parameter to the quantized transform coefficients to obtain transform coefficients, and inversely transform the transform coefficients to restore texture data or depth data.
  • the predictor similarly includes an intra predictor 400 and an inter predictor 500, and reconstructs a predicted image by using information such as a decoded encoding type, transform coefficients for each region, and a motion vector.
  • the intra prediction unit 400 generates the intra prediction image from the decoded sample in the current image.
  • the inter prediction unit 500 generates a prediction image using the reference image stored in the frame storage unit.
  • a reconstructed video frame is generated by adding a residual value for each pixel reconstructed from the inverse transform unit to the predicted image output from the intra predictor 400 or the inter predictor 500.
  • the filtering unit 600 performs filtering on the reconstructed video frame to improve the image quality.
  • This may include a deblocking filter for reducing block distortion and an adaptive loop filter for removing distortion of the entire image.
  • the filtered image is output as the final image and stored in the frame storage unit 700 for use as a reference image for the next frame.
  • Entropy coding may be used in the coding of DCT coefficients, motion vectors, and information requiring high coding efficiency.
  • the input symbols are converted into consecutive codewords, and the length of the codeword may be variable. For example, symbols that occur frequently are represented by short codewords and symbols that do not occur frequently by long codewords.
  • basic coding methods such as Exponential Golomb, Context-based Adaptive Variable Length Coding (CAVLC) and Context-based Adaptive Binary Arithmetic Code (CABAC) Can be used.
  • context-based means adaptively selecting a more efficient coding method according to the surrounding situation.
  • an entropy coding scheme may be selected in consideration of complexity and efficiency. For example, low complexity entropy coding (LCEC) coding is needed for low complexity, and context-based adaptive arithmetic coding is required for high efficiency.
  • LCEC low complexity entropy coding
  • each syntax element uses 10 predetermined variable length coding tables.
  • Each variable-length coding table is defined for various probability distributions.
  • a code number is obtained by using a variable length coding table for each syntax component.
  • the table index of each syntax can be obtained using this code number and the classification table corresponding to each, and the table index is mapped to the value of each code.
  • the classification table is for adaptively adjusting the codeword of each code.
  • context-based adaptive binary arithmetic coding may be used as an entropy encoder to efficiently encode residual data after the transform and quantization processes.
  • CABAC context-based adaptive binary arithmetic coding
  • the entropy decoding unit of the decoding apparatus may also use context-based adaptive binary arithmetic coding.
  • a truncated Golomb-Rice codeword may be used to efficiently encode the level value of the residual data.
  • the existing truncated Golomb-Rice codeword is designed without considering the characteristics of the residual data in video encoding, thereby limiting the coding efficiency. Therefore, the proposed method improves the efficiency of video coding by modifying existing truncated Golomb-Rice codewords in consideration of the characteristics of residual data in video coding.
  • the residual data coding order of context-based adaptive binary arithmetic coding is as follows. First, independently encode the x and y positions of the last non-zero coefficient in the current transform unit (TU) size, and then encode each of the non-zero coefficients to the position of the last non-zero coefficient. do. Finally, the absolute value and sign of the nonzero coefficient are encoded. Details of each encoding order are as follows.
  • the x and y positions of the last nonzero coefficient in the current transform unit size are independently encoded using unary binary coding.
  • the (x, y) position of the last nonzero coefficient is (2, 1). Therefore, the positions of each of x and y are encoded using the unary binary coding of the table below.
  • x is encoded as 001 and y is encoded as 01.
  • position information of each non-zero coefficient is encoded.
  • Information on whether the coefficient value is 0 or not at each scan position is encoded to the position of the last non-zero coefficient. That is, if the value of the coefficient is 0 at the current scan position, encoding is performed as 0, otherwise, as 1.
  • the absolute value and sign of each non-zero coefficient are encoded in 4x4 block units. If the size of the current transform unit is larger than the 4x4 block size, the encoding order of the 4x4 block is performed according to the zigzag scan order.
  • FIG. 2 is an embodiment to which the present application is applied and shows an encoding order of each 4x4 block when the size of a transform unit is larger than the 4x4 block size.
  • Encoding of nonzero coefficients in each 4x4 block is performed according to an inverse zigzag scan order. For example, if the last non-zero coefficient exists in the subB4 block, first, the non-zero coefficient in the subB0 block is encoded in the reverse zigzag scan order. Next, in the subB1 block, non-zero coefficients are encoded in the reverse zigzag scan order. In the same way, nonzero coefficients are encoded in subB2, subB3, and subB4.
  • FIG. 3 illustrates a flowchart and a syntax element of an encoding step of residual data coefficients as an embodiment to which the present application is applied.
  • each 4x4 block an absolute value and a sign of coefficients of residual data are encoded at each scan position according to an inverse zigzag scan order Scan_pos.
  • gr1Flag When gr1Flag is 1, it is again encoded whether or not the absolute value of the coefficient of the residual data is larger than 2 (gr2Flag (coeff_abs_level_greater2_flag)) (S140). If the absolute value of the residual data coefficient is 2, gr2Flag is encoded as 0. If it is larger than 2, gr2Flag is encoded as 1.
  • a value (levelRem (coeff_abs_level_remaining)) obtained by subtracting 3 from the absolute value of the coefficient to be currently encoded is encoded using a binarization codeword (S160).
  • encoding is performed by using two syntax elements gr1Flag and gr2Flag, and when larger than 2, encoding is performed by using a binarization codeword.
  • the binarized codeword will be described in detail with reference to FIGS. 4, 5, and 6.
  • FIG. 4 illustrates an example of a first binarization codeword according to an embodiment to which the present application is applied.
  • the first binarization codeword is a codeword for binarizing an encoding target.
  • the encoding target may be a value obtained by subtracting 3 from an absolute value of the quantized transform coefficients.
  • the information about the first binarized codeword may include a binarized codeword corresponding to the codeword object and the number of bits.
  • the binarized codeword corresponding to the codeword object may be determined from the codeword object and the order information. And the number of bits can be determined from the binarized codeword.
  • the bit number is 0. If the value to be encoded is 1, the bit number is 10, and the value to be encoded is 0. In the case of 2, binarization coding is performed according to the rule of 110 having 3 bits. As the value to be encoded increases, the number of bits required increases.
  • the binarization coding is performed according to the rule of 100 having 3 bits. Compared to the case where the order is 0, the value to be encoded has a large number of bits, but when the value to be encoded is 3 or more, the number of bits is rather small.
  • the value to be encoded is 0, it is 0000 with 4 bits
  • the value to be encoded is 0111 with 4 bits
  • the value to be encoded is 8
  • the binary encoding is performed according to the rule of 10000 having 5 bits.
  • the value to be encoded is 0, 1, 2, or 3 compared to the case of order 2, the number of bits is larger.
  • the value to be encoded is 12 or more, the number of bits is rather small.
  • the value to be encoded is small when the first binarization codeword has a high order, more bits than the low order may be used. However, when the value to be encoded is large, a small number of bits is used. Therefore, when the value to be encoded is large, efficient coding can be performed when using a higher order codeword.
  • Coeff_abs_level_remaining encoding which encodes a coefficient value greater than 2 is performed by using a first binarization codeword. After updating by monotonically increasing the order of the first binarized codeword according to the absolute value of the currently encoded coefficient, the absolute value of the next coefficient is encoded using the updated first binarized codeword.
  • the order increasing condition of the first binarization codeword is as follows.
  • k t represents a current first binarized codeword order
  • k t + 1 represents a first binarized codeword order to be used in the next encoding
  • value t represents the current quantized transform coefficient minus 3.
  • the degree of the first binarized codeword may be increased by using a value obtained by subtracting 3 from the current quantized transform coefficient and the current first binarized codeword order.
  • the first binarization codeword starts encoding using a zeroth order first binarization codeword, and performs encoding while monotonically increasing the order.
  • the first binarization codeword method is based on the assumption that the absolute value of the coefficient to be encoded next is greater than the absolute value of the currently encoded coefficient.
  • the coeff_abs_level_remaining value does not increase continuously from low frequency to high frequency. It may increase but may decrease. Therefore, in the proposed method, the second binarization codeword is designed in consideration of these characteristics.
  • the proposed second binarization codeword which is a modified first binarization
  • a new bit is allocated to allocate fewer bits around the absolute value based on the absolute value at which the update occurs and to allocate more bits as the reference value is moved away from the reference absolute value.
  • a second binarization codeword is designed.
  • FIG 5 shows an example of a second binarization codeword in an embodiment to which the present application is applied.
  • the second binarization codeword is a codeword for binarizing an encoding target.
  • the encoding target may be a value obtained by subtracting 3 from an absolute value of the quantized transform coefficients.
  • Design to assign The second binarized codeword may be designed by modifying or modifying the first binarized codeword. Since the proposed method transforms the first binary coded codeword, it does not require additional memory and can reduce complexity by encoding / decoding fewer bits when performing encoding / decoding.
  • the order condition of the second binarization codeword may be the same as the order condition of the first binarization codeword.
  • the information about the second binary coded codeword may include a binary coded codeword corresponding to the codeword object and the number of bits.
  • the binarized codeword corresponding to the codeword object may be determined from the codeword object and the order information. And the number of bits can be determined from the binarized codeword.
  • the order can be increased to 1 to binarize the codeword target.
  • the order can be increased to two to binarize the codeword target. If there are many encoding targets larger than 5, the order can be increased to 3 to binarize the codeword target.
  • the first binarization codeword can be readjusted to 1001 with 3 bits.
  • FIG. 6 is a flowchart illustrating a decoding method using a second binarization codeword according to an embodiment to which the present application is applied.
  • the binarization mode information is obtained from the bitstream (S200).
  • the binarization mode information is information indicating by which binarization mode the video signal is generated.
  • the binarization mode may include a first binarization codeword, a second binarization codeword, and the like.
  • the order information is determined using the quantized transform coefficients (S210).
  • Order information is information indicating the order of the binarization codeword.
  • the order information may be determined using at least one of quantized transform coefficients and current order information.
  • a codeword corresponding to the quantized transform coefficient may be determined using the order information (S220).
  • order information When order information is determined, a binarization codeword of each quantized transform coefficient is determined.
  • Entropy decoding is performed using the determined codeword (S230).
  • the decoding / encoding device to which the present invention is applied may be provided in a multimedia broadcasting transmission / reception device such as DMB (Digital Multimedia Broadcasting), and may be used to decode video signals and data signals.
  • the multimedia broadcasting transmission / reception apparatus may include a mobile communication terminal.
  • the decoding / encoding method to which the present invention is applied may be stored in a computer-readable recording medium that is produced as a program for execution on a computer, and multimedia data having a data structure according to the present invention may also be read by a computer. It can be stored in the recording medium.
  • the computer readable recording medium includes all kinds of storage devices in which data that can be read by a computer system is stored. Examples of computer-readable recording media include ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical data storage, and the like, which are also implemented in the form of a carrier wave (eg, transmission over the Internet). It also includes.
  • the bitstream generated by the encoding method may be stored in a computer-readable recording medium or transmitted using a wired / wireless communication network.
  • the invention can be used to code a video signal.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 발명은 비트스트림으로부터 이진화 모드 정보와 양자화된 변환 계수를 얻고, 상기 이진화 모드 정보, 상기 양자화된 변환 계수 중 적어도 하나를 이용하여 차수 정보를 결정하고, 상기 차수 정보를 이용하여 제 2 이진화 부호어를 결정하고, 상기 제 2 이진화 부호어를 이용하여 엔트로피 디코딩을 수행하고, 상기 제 2 이진화 부호어는 제 1 이진화 부호어를 수정하여 결정되고, 상기 제 1 이진화 부호어는 상기 차수 정보를 이용하여 양자화된 변환 계수와 대응되는 부호어를 결정하는 것을 특징으로 하는 비디오 디코딩 방법이다. 본 발명은 효율적인 부호어의 결정을 통해 추가적인 메모리 필요가 발생하지 않아, 부호화, 복호화를 수행할 때 더 적은 비트를 부호화, 복호화하여 복잡도를 낮출 수 있다.

Description

비디오 신호 처리 방법 및 장치
본 발명은 비디오 신호의 코딩 방법 및 장치에 관한 것이다.
압축 부호화란 디지털화한 정보를 통신 회선을 통해 전송하거나, 저장 매체에 적합한 형태로 저장하는 일련의 신호 처리 기술을 의미한다. 압축 부호화의 대상에는 음성, 영상, 문자 등의 대상이 존재하며, 특히 영상을 대상으로 압축 부호화를 수행하는 기술을 비디오 영상 압축이라고 일컫는다. 다시점 비디오 영상의 일반적인 특징은 공간적 중복성, 시간적 중복성 및 시점간 중복성을 지니고 있는 점에 특징이 있다.
본 발명의 목적은 비디오 신호의 코딩 효율을 높이고자 함에 있다.
본 발명은 비디오 신호의 잔여 데이터의 특성을 고려하여 부호화, 복호화를 수행하도록 한다. 부호화, 복호화를 수행시 자주 코딩되는 양자화된 변환 계수가 작은 비트를 할당 받도록 부호어를 변형한다.
본 발명은 효율적인 부호어를 결정하여 추가적인 메모리 필요가 발생하지 않아, 부호화, 복호화를 수행할 때 더 적은 비트를 부호화, 복호화하여 복잡도를 낮출 수 있다.
도 1은 본 출원이 적용되는 일실시예로서, 비디오 디코더 장치의 개략적인 블록도를 도시한 것이다.
도 2는 본 출원이 적용되는 일실시예로서, 4X4 블록의 부호화 순서를 도시한 것이다.
도 3은 본 출원이 적용되는 일실시예로서, 양자화된 잔여 데이터의 부호화 단계 흐름도를 도시한 것이다.
도 4는 본 출원이 적용되는 일실시예로서, 제 2 이진화 부호어의 예를 도시한 것이다.
도 5는 본 출원이 적용되는 일실시예로서, 제 1 이진화 부호어의 예를 도시한 것이다.
도 6은 본 출원이 적용되는 일실시예로서, 이진화 부호어를 이용한 디코딩 방법 흐름도를 도시한 것이다.
본 발명은 비트스트림으로부터 이진화 모드 정보와 양자화된 변환 계수를 얻고, 상기 이진화 모드 정보, 상기 양자화된 변환 계수 중 적어도 하나를 이용하여 차수 정보를 결정하고, 상기 차수 정보를 이용하여 제 2 이진화 부호어를 결정하고, 상기 제 2 이진화 부호어를 이용하여 엔트로피 디코딩을 수행하고, 상기 제 2 이진화 부호어는 제 1 이진화 부호어를 수정하여 결정되고, 상기 제 1 이진화 부호어는 상기 차수 정보를 이용하여 양자화된 변환 계수와 대응되는 부호어를 결정합니다.
다시점 비디오 신호 데이터를 압축 부호화 또는 복호화하는 기술은 공간적 중복성, 시간적 중복성 및 시점간 존재하는 중복성을 고려하고 있다. 또한, 다시점 영상의 경우, 3차원 영상을 구현하기 위해 2개 이상의 시점에서 촬영된 다시점 텍스쳐 영상 및 이에 대응되는 다시점 뎁스 영상을 코딩해야 한다. 뎁스 영상을 코딩함에 있어서, 공간적 중복성, 시간적 중복성 또는 시점간 중복성을 고려하여 압축 코딩할 수 있음은 물론이다. 뎁스 영상의 각 샘플값은 카메라와 해당 화소 간의 거리 정보를 표현한 것이다. 또한, 본 명세서 내에서 뎁스 정보, 뎁스 데이터, 뎁스 픽쳐, 뎁스 시퀀스, 뎁스 코딩, 뎁스 비트스트림 등과 같은 용어들은 뎁스에 관련된 정보로 유연하게 해석될 수 있을 것이다. 코딩은 경우에 따라 인코딩 또는 디코딩으로 해석될 수 있고, 정보(information)는 값(values), 파라미터(parameter), 계수(coefficients), 성분(elements) 등을 모두 포함하는 용어로서, 경우에 따라 적절한 의미로 해석될 수 있다. ‘화면’ 또는 ‘픽쳐(picture)’는 일반적으로 특정 시간대의 하나의 영상을 나타내는 단위를 의미하며, ‘슬라이스(slice)’, ‘프레임(frame)’ 등은 실제 비디오 신호에의 코딩에 있어서 픽쳐의 일부를 구성하는 단위이기는 하나, 필요에 따라서는 서로 혼용되어 사용 될 수 있다. ‘픽셀(pixel)’, ‘화소’ 또는 ‘pel’은 하나의 영상을 구성하는 최소의 단위를 의미하는 것이다. 특정한 픽셀의 값을 나타내는 용어로써 ‘샘플(sample)’을 사용할 수 있다. 샘플은 휘도(Luma) 및 색차(Chroma) 성분으로 나누어질 수 있으나, 일반적으로는 이를 모두 포함하는 용어로써 사용되었다. 상기에서 색차 성분은 정해진 색상들간의 차이를 나타내는 것으로 일반적으로 Cb 및 Cr로 구성된다. '유닛(unit)'은 영상 처리의 기본 단위 또는 영상의 특정 위치를 지칭하는 의미로 사용되었으며, 경우에 따라서는 '블록(block)' 또는 '영역(area)' 등의 용어와 서로 혼용하여 사용될 수 있다. 다만 일반적인 경우에 있어서 블록은 M개의 열과 N개의 행으로 구성된 샘플들 또는 변환 계수(transform coefficient)들의 집합을 나타내는 용어로 사용된다.
본 발명의 일 실시예에 따른 인코딩 장치는 변환부, 양자화부, 역양자화부, 역변환부, 필터링부, 예측부 및/또는 엔트로피 코딩부 등을 포함하여 구성된다.
변환부는 입력 받은 비디오 신호에 대한 화소값을 변환하여 변환 계수값을 획득한다. 이러한 변환 방법으로는, 예를 들어, 이산 코사인 변환(DCT:Discrete Cosine Transform) 또는 웨이블릿 변환(Wavelet Transform) 등이 사용될 수 있다. 변환부에서는 입력된 영상 신호를 일정 크기의 유닛으로 나누어 변환을 수행하게 된다.
양자화부는 변환부에서 출력된 변환 계수 값을 양자화한다.
필터링부에서는 영상의 품질 개선을 위한 필터링 연산을 수행한다. 필터링부에서 사용되는 필터로는 예를 들어, 디블록킹 필터 및/또는 적응적 루프 필터 등이 포함될 수 있다. 프레임 저장부는 복원된 영상을 출력하거나 참조 영상으로 이용하기 위하여 저장한다.
코딩 효율을 높이기 위하여 영상 신호를 그대로 코딩하는 것이 아니라, 이미 코딩된 영역을 이용하여 영상을 예측하고, 예측된 영상에 원 영상과 예측 영상간의 레지듀얼 값을 더하여 복원 영상을 획득하는 방법이 사용된다. 영상을 예측하는 방법으로는 화면 내 예측 (intra prediction), 화면 간 예측 (inter prediction) 등이 사용될 수 있으며, 따라서 예측부는 인트라 예측부와 인터 예측부를 포함할 수 있다.
인트라 예측부는 현재 영상 내의 복원된 영역들로부터 화면내 예측을 수행하여, 화면내 부호화 정보를 엔트로피 코딩부에 전달한다. 인터 예측부에서는 프레임 저장부에 저장된 적어도 하나 이상의 참조 영상을 이용하여 현재 영상을 예측하고, 화면간 움직임 보상을 수행한다.
엔트로피 코딩부는 양자화된 변환 계수, 화면간 부호화 정보, 화면내 부호화 정보 및 인터 예측부로부터 입력된 참조 영역 정보 등을 엔트로피 코딩하여 비디오 신호 비트스트림을 생성한다. 엔트로피 코딩부에서는 가변 길이 코딩(VLC: Variable Length Coding) 방식과 산술 코딩(arithmetic coding) 등이 사용될 수 있다.
한편, 비디오 신호 디코딩 장치의 동작은 인코더에서의 동작에 대응되어 그 역과정을 수행할 수 있다.
도 1은 본 발명이 적용되는 일실시예로서, 비디오 디코더의 개략적인 블록도를 도시한 것이다.
본 발명의 실시예에 따른 디코딩 장치는 파싱부(100), 엔트로피 디코딩부(200), 역양자화부/역변환부(300), 필터링부(600), 인트라 예측부(400), 인터 예측부(500), 프레임 저장부(700) 등을 포함하여 구성된다.
파싱부(100)는 입력된 비트스트림을 복호화하기 위해 NAL 단위로 파싱을 수행한다. 입력된 비트스트림이 다시점 관련 데이터인 경우, 입력된 비트스트림은 카메라 파라미터를 포함할 수 있다. 카메라 파라미터에는 고유의 카메라 파라미터 및 비고유의 카메라 파라미터가 있을 수 있는데, 고유의 카메라 파라미터는 초점 거리, 가로세로비, 주점 등이 있을 수 있고, 비고유의 카메라 파라미터에는 세계 좌표계에서의 카메라의 위치정보 등이 있을 수 있다.
엔트로피 디코딩부(200)는 엔트로피 코딩의 역과정으로, 비디오 신호 비트스트림을 엔트로피 디코딩하여 부호화 타입, 각 영역에 대한 양자화된 변환 계수, 텍스쳐 픽쳐와 뎁스 픽쳐의 예측을 위한 코딩 정보 등을 추출할 수 있다.
역양자화/역변환부(300)에서는 양자화된 변환 계수에 양자화 파라미터를 적용하여 변환 계수를 획득하고, 변환 계수를 역변환하여 텍스쳐 데이터 또는 뎁스 데이터를 복원할 수 있다.
예측부는 마찬가지로 인트라 예측부(400) 및 인터 예측부(500)를 포함하고, 디코딩된 부호화 타입, 각 영역에 대한 변환 계수, 모션 벡터 등의 정보를 활용하여 예측 영상을 복원하게 된다. 인트라 예측부(400)에서는 현재 영상 내의 디코딩된 샘플로부터 화면내 예측 영상을 생성하게 된다. 또한, 상기 인터 예측부(500)는 프레임 저장부에 저장된 참조 영상을 이용하여 예측 영상을 생성하게 된다. 상기 인트라 예측부(400) 또는 인터 예측부(500)로부터 출력된 예측 영상에 역변환부로부터 복원된 각 화소에 대한 레지듀얼값이 더해져서 복원된 비디오 프레임이 생성된다.
한편, 필터링부(600)는 복원된 비디오 프레임에 대한 필터링을 수행하여 화질을 향상시킨다. 여기에는 블록 왜곡 현상을 감소시키기 위한 디블록킹 필터, 영상 전체의 왜곡 제거를 위한 적응적 루프 필터 등이 포함될 수 있다. 필터링을 거친 영상은 최종 영상으로 출력되고, 또한 다음 프레임에 대한 참조 영상으로 이용하기 위하여 프레임 저장부(700)에 저장된다.
DCT 계수나 모션 벡터와 높은 부호화 효율이 요구되는 정보들의 부호에서는 엔트로피 코딩(가변길이 부호화) 방식이 이용될 수 있다. 여기에서 입력되는 심볼들을 연속적인 코드워드로 변환하는데, 코드워드의 길이는 가변적일 수 있다. 예를 들어, 자주 발생하는 심볼들을 짧은 코드워드로 자주 발생하지 않은 심볼들은 긴 코드워드로 표현하는 것이다. 지수 골롬(Exponential Golomb)과 같은 기본적인 부호화 방법 외에 컨텍스트 기반 적응형 가변 길이 코딩(CAVLC: Context-based Adaptive Variable Length Coding), 컨텍스트 기반 적응형 산술 부호화(CABAC: Context-based Adaptive Binary Arithmetic Code) 등이 이용될 수 있다. 여기에서 컨텍스트-기반이란 주위의 상황에 따라 보다 효율이 좋은 부호화 방식을 적응적으로 선택한다는 의미이다.
한편, 본 발명에서는 복잡도 및 효율을 고려하여 엔트로피 코딩 방식을 선택할 수 있다. 예를 들어, 낮은 복잡도를 원하는 경우 저복잡도 엔트로피 코딩(Low complexity entropy coding, LCEC) 코딩을, 높은 효율을 원할 때에는 컨텍스트 기반 적응형 산술 부호화을 이용하는 것이다.
저복잡도 엔트로피 코딩 를 사용할 때에는 기본적으로 각 신택스 성분(syntax element)을 10개의 기 결정된 가변길이 코딩 표를 이용한다. 각 가변길이 코딩 표는 여러 가지 확률분포에 맞게 정해져 있다. 먼저 각 신택스 성분을 각각에 맞는 가변길이 코딩 표를 이용하여 코드 번호를 얻어낸다. 이 코드 번호와 각각에 맞는 분류표를 사용하여 각 신택스의 표 인덱스를 얻을 수 있고, 이 표 인덱스는 각각의 부호의 값으로 매핑된다. 분류표란 각 부호의 부호어를 적응적으로 조절하기 위한 것이다.
비디오 압축 표준에서는 변환과 양자화 과정 후, 잔여 데이터를 효율적으로 부호화하기 위해 엔트로피 부호기로 문맥 기반 적응적 이진 산술 부호화(context-based adaptive binary arithmetic coding, CABAC)를 사용할 수 있다. 디코딩 장치의 엔트로피 디코딩부에서도 문맥 기반 적응적 이진 산술 부호화를 사용할 수 있다.
이하에서는 본 출원에서 제안하는 엔트로피 코딩 방법에 대해서 설명하기로 한다.
본 발명의 실시예로서, 잔여 데이터의 레벨 값을 효율적인 부호화를 위해 절삭된 골롬-라이스 부호어를 사용 수 있다. 하지만, 기존의 절삭된 골롬-라이스 부호어는 비디오 부호화에서 잔여 데이터의 특성을 고려하지 않고 설계되어 부호화 효율에 한계가 있다. 따라서 제안하는 방법은 비디오 부호화에서 잔여 데이터의 특성을 고려하여 기존의 절삭된 골롬-라이스 부호어를 변형하여 비디오 부호화의 효율을 높인다.
문맥 기반 적응적 이진 산술 부호화의 잔여 데이터 부호화 순서는 다음과 같다. 먼저 현재 변환 단위 (transform unit, TU) 크기에서 마지막 0이 아닌 계수의 x 위치와 y 위치를 각각 독립적으로 부호화한 후, 부호화된 마지막 0이 아닌 계수의 위치까지 0이 아닌 계수들의 위치를 각각 부호화한다. 마지막으로 0이 아닌 계수의 절대값과 부호를 부호화한다. 각 부호화 순서의 자세한 내용은 다음과 같다.
먼저 양자화 변환 후, 현재 변환 단위 크기에서 마지막 0이 아닌 계수의 x와 y위치를 단항 이진부호화를 사용하여 독립적으로 부호화한다. 예를 들어, 마지막 0이 아닌 계수의 (x, y) 위치는 (2, 1)이다. 따라서, x와 y 각각의 위치를 아래 표의 단항 이진부호화를 사용하여 부호화한다. 그 결과, x는 001로 y는 01로 부호화된다.
마지막 0이 아닌 계수의 위치를 부호화한 다음, 각 0이 아닌 계수의 위치 정보를 부호화한다. 마지막 0이 아닌 계수의 위치까지 각 스캔 위치에서 계수의 값이 0인지 아닌지에 대한 정보를 각각 부호화한다. 즉, 현재 스캔 위치에서 계수의 값이 0이면 0으로, 0이 아니면 1로 부호화를 수행한다.
다음으로 4x4 블록 단위로 각 0이 아닌 계수의 절대 값과 부호를 부호화한다. 현재 변환 단위의 크기가 4x4 블록 크기보다 큰 경우, 4x4 블록의 부호화 순서는 지그재그 스캔 순서에 따라 수행된다.
도 2는 본 출원이 적용되는 일실시예로서, 변환 단위의 크기가 4x4 블록 크기보다 큰 경우에 각 4x4 블록의 부호화 순서를 나타낸다. 도 2에서 subBN (N=0, 1, 2, 3, ..)은 각 4x4 블록을 나타낸다. 각 4x4 블록에서 0이 아닌 계수의 부호화는 역 지그재그 스캔 순서에 따라 수행된다. 예를 들어, 마지막 0이 아닌 계수가 subB4 블록 내에 존재한다면, 먼저 subB0 블록 내에서 0이 아닌 계수를 역 지그재그 스캔 순서에 따라 부호화한다. 다음으로 subB1 블록 내에서 다시 0이 아닌 계수를 역 지그재그 스캔 순서에 따라 부호화한다. 동일한 방법으로 subB2, subB3, subB4에서 0이 아닌 계수를 부호화한다.
도 3는 본 출원이 적용되는 일실시예로서, 잔여 데이터 계수의 부호화 단계의 흐름도와 신택스 요소를 나타낸다.
각 4x4 블록 내에서 역 지그재그 스캔 순서(Scan_pos)에 따라 각 스캔 위치에서 잔여 데이터의 계수(Coefficients)의 절대 값과 부호를 부호화한다.
각 스캔 위치에서 잔여 데이터의 계수 값이 0인지 아닌지 여부를 부호화(significantFlag)한다(S100). 만약 계수 값이 0이면 significantFlag는 0으로, 만약 계수의 값이 0이 아니면 1로 부호화한다.
다음으로 잔여 데이터의 계수의 절대값이 1보다 큰지 여부를 부호화(gr1Flag(coeff_abs_level_greater1_flag))한다(S120). 잔여 데이터의 계수의 절대값이 1이면 gr1Flag는 0으로, 1보다 크면 gr1Flag는 1로 부호화한다.
gr1Flag는 1인 경우, 다시 잔여 데이터의 계수의 절대값이 2보다 큰지 여부를 부호화(gr2Flag(coeff_abs_level_greater2_flag))한다(S140). 잔여 데이터의 계수의 절대값이 2이면 gr2Flag는 0으로, 2보다 크면 gr2Flag는 1로 부호화한다.
gr2Flag 값이 1인 경우, 현재 부호화하고자 하는 계수의 절대 값에서 3을 뺀 값(levelRem(coeff_abs_level_remaining))을 이진화 부호어를 사용하여 부호화한다(S160).
즉, 양자화된 변환 계수의 절대 값이 1 또는 2인 경우는 두 신택스 요소 gr1Flag와 gr2Flag를 사용하여 부호화를 수행하고, 2보다 큰 경우에 대해서는 이진화 부호어를 사용하여 부호화를 수행한다. 이진화 부호어에 대해서는 도 4, 도 5 그리고 도 6에서 자세히 설명하기로 한다,
마지막으로 계수의 부호를 부호화(coeff_sign_flag)한다(S180).
도 4는 본 출원이 적용되는 일 실시예로, 제 1 이진화 부호어의 예를 나타낸 것이다.
제 1 이진화 부호어는 부호화 대상을 이진화 하기 위한 부호어이다. 부호화 대상은 양자화된 변환 계수의 절대 값에서 3을 뺀 값일 수 있다.
제 1 이진화 부호어에 관한 정보는 부호어 대상과 대응되는 이진화 부호어와 비트수를 포함할 수 있다. 부호어 대상과 대응되는 이진화 부호어는 부호어 대상과 차수 정보로부터 결정될 수 있다. 그리고 비트수는 이진화 부호어로부터 결정될 수 있다.
제 1 이진화 부호어의 차수가 0인 경우(k=0), 부호화 하려는 값이 0인 경우 비트수가 1인 0으로, 부호화 하려는 값이 1인 경우, 비트수가 2인 10으로, 부호화하려는 값이 2인 경우, 비트수가 3인 110의 규칙으로 이진화 부호화를 한다. 부호화 하려는 값이 커질수록 필요한 비트수가 늘어나게 된다.
제 1 이진화 부호어의 차수가 1인 경우(k=1), 부호화 하려는 값이 0인 경우 비트수가 2인 00으로, 부호화하려는 값이 1인 경우 비트수가 2인 01로, 부호화 하려는 값이 2인 경우 비트수가 3인 100의 규칙으로 이진화 부호화를 한다. 차수가 0인 경우와 비교하여 부호화하려는 값이 0인 경우에는 많은 비트수를 갖지만, 부호화하려는 값이 3이상인 경우에는 오히려 적은 비트수를 갖게 된다.
제 1 이진화 부호어의 차수가 2인 경우(k=2), 부호화 하려는 값이 0인 경우 비트수가 3인 000으로, 부호화하려는 값이 3인 경우 비트수가 3인 011로, 부호화 하려는 값이 4인 경우 비트수가 1000의 규칙으로 이진화 부호화를 한다. 차수가 1인 경우와 비교하여 부호화하려는 값이 0,1인 경우에는 많은 비트수를 갖지만, 부호화하려는 값이 6이상인 경우에는 오히려 적은 비트수를 갖게 된다.
제 1 이진화 부호어의 차수가 3인 경우(k=3), 부호화 하려는 값이 0인 경우 비트수가 4인 0000으로, 부호화하려는 값이 7인 경우 비트수가 4인 0111으로, 부호화하려는 값이 8인 경우 비트수가 5인 10000의 규칙으로 이진화 부호화를 한다. 차수가 2인 경우와 비교하여 부호화하려는 값이 0,1,2,3인 경우에는 많은 비트수를 갖지만, 부호화하려는 값이 12이상인 경우에는 오히려 적은 비트수를 갖게 된다.
제 1 이진화 부호어에서 높은 차수를 가진 경우에 부호화 하려는 값이 작으면 낮은 차수보다 많은 비트수를 사용할 수 있다. 그러나, 부호화 하려는 값이 큰 경우에는 오히려 적은 비트수를 사용하므로 부호화 하려는 값이 큰 경우 높은 차수의 부호어를 사용할 때 효율적인 코딩을 할 수 있다.
제 1 이진화 부호어를 사용하여 2보다 큰 계수 값을 부호화하는 coeff_abs_level_remaining 부호화를 수행한다. 현재 부호화한 계수의 절대 값에 따라 제 1 이진화 부호어의 차수를 단조 증가시키면서 업데이트한 후, 업데이트 된 제 1 이진화 부호어를 사용하여 다음 계수의 절대 값을 부호화한다. 제 1 이진화 부호어의 차수 증가 조건은 아래와 같다.
Figure PCTKR2013003513-appb-I000001
여기서, kt는 현재 제 1 이진화 부호어 차수를 나타내고, kt+1은 다음 부호화에서 사용할 제 1 이진화 부호어 차수를 나타낸다. valuet는 현재 양자화된 변환 계수에서 3을 뺀 값을 나타낸다. 제 1 이진화 부호어의 차수는 현재 양자화된 변환 계수에서 3을 뺀 값과 현재 제 1 이진화 부호어 차수를 이용하여 증가여부를 판단할 수 있다.
제 1 이진화 부호어는 0차 제 1 이진화 부호어를 사용하여 부호화를 시작하여 점차 차수를 단조 증가시키면서 부호화를 수행한다. 제 1 이진화 부호어 방법은 다음에 부호화할 계수의 절대 값이 현재 부호화한 계수의 절대 값보다 크다는 가정을 전제로 한다.
그러나, 제 1 이진화 부호어를 살펴보면 이러한 가정을 고려하여 적합하게 설계되어 있지 않다. 즉, 차수가 0인(k=0) 제 1 이진화 부호어에서 차수가 1인(k=1) 제 1 이진화 부호어로 부호표가 업데이트가 되었다는 의미는 다음에 부호화할 coeff_abs_level_remaining 값이 최소한 0 또는 1보다는 크다는 것을 가정한다는 것이다. 따라서, 차수가 1인(k=1) 제 1 이진화 부호어에서는 절대 값이 0과 1보다는 2와 3에 더 적은 비트를 할당해야 한다. 동일한 방법으로 차수가 1인 (k=1)제 1 이진화 부호어에서 차수가 2인(k=2) 제 1 이진화 부호어로 부호표가 업데이트가 된다면, 차수가 2인(k=2) 제 1 이진화 부호어를 사용하여 부호화할 가능성이 높은 절대 값 영역에 더 적은 비트를 할당해야 한다. 즉, 4보다 큰 coeff_abs_level_remaining 값에 더 적은 비트를 할당해야 한다는 의미이다.
그러나, 실제로는 coeff_abs_level_remaining 값은 저주파에서 고주파로 가면서 계속 증가하지만은 않는다. 증가할 수도 있지만 감소할 수도 있다. 따라서, 제안하는 방법에서는 이러한 특성도 고려하여 제 2 이진화 부호어를 설계한다.
제안하는 제 2 이진화 부호어는 제 1 이진화 부호어의 0차, 1차, 2차 부호어에서 제 1 이진화 부호어의 차수를 증가시키는 경계선 영역에 더 적은 비트를 할당한다. 예를 들어, 차수가 0인(k=0) 제 1 이진화 부호어를 사용하여 부호화를 수행할 때, coeff_abs_level_remaining 값이 1보다 크면 차수가 0인(k=0) 제 1 이진화 부호어를 차수가 1인(k=1) 제 1 이진화 부호어로 업데이트하고 이를 이용하여 다음 coeff_abs_level_remaining 값을 부호화한다. 따라서, 제안하는 변형된 제 1 이진화인 제 2 이진화 부호어에서는 업데이트가 발생하는 절대 값을 기준으로 하여 주변에 더 적은 비트를 할당하고 기준이 되는 절대 값에서 멀어짐에 따라 더 많은 비트를 할당하도록 새로이 제 2 이진화 부호어를 설계한다.
도 5는 본 출원이 적용되는 일실시예로, 제 2 이진화 부호어의 예를 나타낸 것이다.
제 2 이진화 부호어는 부호화 대상을 이진화 하기 위한 부호어이다. 부호화 대상은 양자화된 변환 계수의 절대 값에서 3을 뺀 값일 수 있다. 제 2 이진화 부호어를 살펴보면 각 차수의 이진화 부호어에서 부호화 효율을 높이기 위해 업데이트가 발생하는 영역을 기준으로 주위에 더 적은 비트를 할당하도록 설계하고, 업데이트가 발생하는 영역에서 멀어짐에 따라 더 많은 비트를 할당하도록 설계한다. 제 2 이진화 부호어는 제 1 이진화 부호어를 수정하거나, 변형하여 설계할 수 있다. 제안하는 방법은 제 1 이진화 부호어를 변형하므로 추가적인 메모리 필요가 발생하지 않고 부/복호화를 수행할 때 더 적은 비트를 부/복호화하여 복잡도를 낮출 수 있다.
제 2 이진화 부호어의 차수 조건은 제 1 이진화 부호어의 차수 조건과 동일 할 수 있다.
제 2 이진화 부호어에 관한 정보는 부호어 대상과 대응되는 이진화 부호어와 비트수를 포함할 수 있다. 부호어 대상과 대응되는 이진화 부호어는 부호어 대상과 차수 정보로부터 결정될 수 있다. 그리고 비트수는 이진화 부호어로부터 결정될 수 있다.
1보다 큰 부호화 대상이 많은 경우, 차수를 1로 증가하여 부호어 대상을 이진화 할 수 있다. 2보다 큰 부호화 대상이 많은 경우, 차수를 2로 증가하여 부호어 대상을 이진화 할 수 있다. 5보다 큰 부호화 대상이 많은 경우, 차수를 3으로 증가하여 부호어 대상을 이진화 할 수 있다.
제 2 이진화 부호어의 차수 정보가 1인 경우(k=1)에는, 부호화 하려는 값이 0인 경우에 비트수가 3인 100으로, 부호화 하려는 값이 1인 경우에 비트수가 2인 00으로, 부호화 하려는 값이 2인 경우에 비트수가 2인 01로 제 1 이진화 부호어를 재조정할 수 있다.
제 2 이진화 부호어의 차수 정보가 2인 경우(k=2)에는 부호화 하려는 값이 0인 경우에 비트수가 4인 1000으로, 부호화 하려는 값이 1인 경우에 비트수가 4인 1001로, 부호화 하려는 값이 2인 경우에 비트수가 3인 000으로, 부호화 하려는 값이 3인 경우에 비트수가 3인 001로, 부호화 하려는 값이 4인 경우에 비트수가 3인 010으로, 부호화 하려는 값이 5인 경우에 비트수가 3인 1001로 제 1 이진화 부호어를 재조정할 수 있다.
제 2 이진화 부호어의 차수 정보가 3인 경우(k=3)에는 부호화 하려는 값이 0인 경우에 비트수가 5인 10000으로, 부호화 하려는 값이 1인 경우에 비트수가 5인 10001로, 부호화 하려는 값이 2인 경우에 비트수가 5인 10010으로, 부호화 하려는 값이 3인 경우에 비트수가 5인 10011로, 부호화 하려는 값이 4인 경우에 비트수가 5인 10100으로, 부호화 하려는 값이 8인 경우에 비트수가 4인 0000으로, 부호화 하려는 값이 9인 경우에 비트수가 4인 0001로, 부호화 하려는 값이 10인 경우에 비트수가 4인 0010로, 부호화 하려는 값이 11인 경우에 비트수가 4인 0011로, 부호화 하려는 값이 12인 경우에 비트수가 4인 0100으로 제 1 이진화 부호어를 재조정할 수 있다.
도 6은 본 출원이 적용되는 일실시예로, 제 2 이진화 부호어를 이용한 디코딩 방법의 흐름도를 도시한 것이다.
비트스트림을 수신하면, 비트스트림으로부터 이진화 모드 정보를 획득한다(S200). 이진화 모드 정보는 비디오 신호가 어떠한 이진화 모드에 의해 생성되었는지를 나타내는 정보이다. 이진화 모드에는 제 1 이진화 부호어, 제 2 이진화 부호어 등이 있을 수 있다.
양자화된 변환 계수를 이용하여 차수 정보를 결정한다(S210). 차수 정보는 이진화 부호어의 차수를 나타내는 정보이다. 차수 정보는 양자화된 변환 계수, 현재 차수 정보 중 적어도 하나를 이용하여 결정될 수 있다.
차수 정보를 이용하여 양자화된 변환 계수에 대응되는 부호어를 결정할 수 있다(S220). 차수 정보가 결정되면 각 양자화된 변환 계수의 이진화 부호어가 결정된다.
결정된 부호어를 이용하여 엔트로피 디코딩을 수행한다(S230).
이상에서 설명한 바와 같이, 본 발명이 적용되는 디코딩/인코딩 장치는 DMB(Digital Multimedia Broadcasting)과 같은 멀티미디어 방송 송/수신 장치에 구비되어, 비디오 신호 및 데이터 신호 등을 디코딩하는데 사용될 수 있다. 또한 상기 멀티미디어 방송 송/수신 장치는 이동통신 단말기를 포함할 수 있다.
또한, 본 발명이 적용되는 디코딩/인코딩 방법은 컴퓨터에서 실행되기 위한 프로그램으로 제작되어 컴퓨터가 읽을 수 있는 기록 매체에 저장될 수 있으며, 본 발명에 따른 데이터 구조를 가지는 멀티미디어 데이터도 컴퓨터가 읽을 수 있는 기록 매체에 저장될 수 있다. 상기 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 저장 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어, 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한, 상기 인코딩 방법에 의해 생성된 비트스트림은 컴퓨터가 읽을 수 있는 기록 매체에 저장되거나, 유/무선 통신망을 이용해 전송될 수 있다.
본 발명은 비디오 신호를 코딩하는데 이용될 수 있다.

Claims (8)

  1. 비트스트림으로부터 이진화 모드 정보와 양자화된 변환 계수를 얻는 단계;
    상기 이진화 모드 정보, 상기 양자화된 변환 계수 중 적어도 하나를 이용하여 차수 정보를 결정하는 단계;
    상기 차수 정보를 이용하여 제 2 이진화 부호어를 결정하는 단계;
    상기 제 2 이진화 부호어를 이용하여 엔트로피 디코딩을 수행하는 단계; 를 포함하고,
    상기 제 2 이진화 부호어는 제 1 이진화 부호어를 수정하여 결정되고,
    상기 제 1 이진화 부호어는 상기 차수 정보를 이용하여 양자화된 변환 계수와 대응되는 부호어를 결정하는 것을 특징으로 하는 비디오 디코딩 방법.
  2. 제 1항에 있어서,
    상기 제 2 이진화 부호어는 상기 차수 정보가 1인 경우, 제 1 이진화 부호어의 상기 양자화된 변환 계수의 절대값이 0인 경우와 2인 경우의 부호어를 바꾸는 것을 특징으로 하는 비디오 디코딩 방법.
  3. 제 1항에 있어서,
    상기 제 2 이진화 부호어는 상기 차수 정보가 2인 경우, 제 1 이진화 부호어의 상기 양자화된 변환 계수의 절대값이 0인 경우와 4인 경우의 부호어를 바꾸고, 제 2 이진화 부호어의 상기 양자화된 변환 계수의 절대값이 1인 경우와 5인 경우의 부호어를 바꾸는 것을 특징으로 하는 비디오 디코딩 방법.
  4. 제 1항에 있어서,
    상기 제 2 이진화 부호어는 상기 차수 정보가 3인 경우, 제 1 이진화 부호어의 상기 양자화된 변환 계수의 절대값이 0인 경우와 8인 경우의 부호어를 바꾸고, 제 2 이진화 부호어의 상기 양자화된 변환 계수의 절대값이 1인 경우와 9인 경우의 부호어를 바꾸고, 제 2 이진화 부호어의 상기 양자화된 변환 계수의 절대값이 2인 경우와 10인 경우의 부호어를 바꾸고, 제 2 이진화 부호어의 상기 양자화된 변환 계수의 절대값이 3인 경우와 11인 경우의 부호어를 바꾸고, 제 2 이진화 부호어의 상기 양자화된 변환 계수의 절대값이 4인 경우와 12인 경우의 부호어를 바꾸는 것을 특징으로 하는 비디오 디코딩 방법.
  5. 비트스트림으로부터 이진화 모드 정보와 양자화된 변환 계수를 얻는 파싱부;
    상기 이진화 모드 정보, 상기 양자화된 변환 계수 중 적어도 하나를 이용하여 차수 정보를 결정하고, 상기 차수 정보를 이용하여 제 2 이진화 부호어를 결정하고, 상기 제 2 이진화 부호어를 이용하여 엔트로피 디코하는 엔트로피 디코딩부; 및
    상기 제 2 이진화 부호어를 제 1 이진화 부호어를 수정하여 결정하고, 상기 차수 정보를 이용하여 양자화된 변환 계수와 대응되는 부호어를 결정하는 제 1 이진화 부호어를 결정하는 상기 엔트로피 디코딩부를 포함하는 것을 특징으로 하는 비디오 디코딩 장치.
  6. 제 5항에 있어서,
    상기 제 2 이진화 부호어는 상기 차수 정보가 1인 경우, 제 1 이진화 부호어의 상기 양자화된 변환 계수의 절대값이 0인 경우와 2인 경우의 부호어를 바꾸는 것을 특징으로 하는 비디오 디코딩 장치.
  7. 제 5항에 있어서,
    상기 제 2 이진화 부호어는 상기 차수 정보가 2인 경우, 제 1 이진화 부호어의 상기 양자화된 변환 계수의 절대값이 0인 경우와 4인 경우의 부호어를 바꾸고, 제 2 이진화 부호어의 상기 양자화된 변환 계수의 절대값이 1인 경우와 5인 경우의 부호어를 바꾸는 것을 특징으로 하는 비디오 디코딩 장치.
  8. 제 5항에 있어서,
    상기 제 2 이진화 부호어는 상기 차수 정보가 3인 경우, 제 1 이진화 부호어의 상기 양자화된 변환 계수의 절대값이 0인 경우와 8인 경우의 부호어를 바꾸고, 제 2 이진화 부호어의 상기 양자화된 변환 계수의 절대값이 1인 경우와 9인 경우의 부호어를 바꾸고, 제 2 이진화 부호어의 상기 양자화된 변환 계수의 절대값이 2인 경우와 10인 경우의 부호어를 바꾸고, 제 2 이진화 부호어의 상기 양자화된 변환 계수의 절대값이 3인 경우와 11인 경우의 부호어를 바꾸고, 제 2 이진화 부호어의 상기 양자화된 변환 계수의 절대값이 4인 경우와 12인 경우의 부호어를 바꾸는 것을 특징으로 하는 비디오 디코딩 장치.
PCT/KR2013/003513 2012-04-24 2013-04-24 비디오 신호 처리 방법 및 장치 WO2013162283A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201261637276P 2012-04-24 2012-04-24
US61/637,276 2012-04-24

Publications (1)

Publication Number Publication Date
WO2013162283A1 true WO2013162283A1 (ko) 2013-10-31

Family

ID=49483503

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2013/003513 WO2013162283A1 (ko) 2012-04-24 2013-04-24 비디오 신호 처리 방법 및 장치

Country Status (1)

Country Link
WO (1) WO2013162283A1 (ko)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070034917A (ko) * 2005-09-26 2007-03-29 삼성전자주식회사 엔트로피 코딩의 성능 향상 방법 및 장치, 상기 방법을이용한 비디오 코딩 방법 및 장치
KR20070062391A (ko) * 2005-12-12 2007-06-15 삼성전자주식회사 Fgs 계층의 블록에 포함되는 계수의 특성에 따라 비디오신호를 부호화하고 복호화하는 방법 및 장치
KR20090089414A (ko) * 2006-11-14 2009-08-21 퀄컴 인코포레이티드 메모리 효율적인 적응성 블록 코딩
KR20090097013A (ko) * 2008-03-10 2009-09-15 삼성전자주식회사 영상 부호화장치 및 영상 복호화장치
US20100074544A1 (en) * 2008-09-23 2010-03-25 Mediatek Inc. Transcoding method
JP2011024066A (ja) * 2009-07-17 2011-02-03 Sony Corp 画像処理装置および方法
KR20110102451A (ko) * 2008-12-09 2011-09-16 퀄컴 인코포레이티드 가변-대-고정 길이 코드들의 빠른 분석

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070034917A (ko) * 2005-09-26 2007-03-29 삼성전자주식회사 엔트로피 코딩의 성능 향상 방법 및 장치, 상기 방법을이용한 비디오 코딩 방법 및 장치
KR20070062391A (ko) * 2005-12-12 2007-06-15 삼성전자주식회사 Fgs 계층의 블록에 포함되는 계수의 특성에 따라 비디오신호를 부호화하고 복호화하는 방법 및 장치
KR20090089414A (ko) * 2006-11-14 2009-08-21 퀄컴 인코포레이티드 메모리 효율적인 적응성 블록 코딩
KR20090097013A (ko) * 2008-03-10 2009-09-15 삼성전자주식회사 영상 부호화장치 및 영상 복호화장치
US20100074544A1 (en) * 2008-09-23 2010-03-25 Mediatek Inc. Transcoding method
KR20110102451A (ko) * 2008-12-09 2011-09-16 퀄컴 인코포레이티드 가변-대-고정 길이 코드들의 빠른 분석
JP2011024066A (ja) * 2009-07-17 2011-02-03 Sony Corp 画像処理装置および方法

Similar Documents

Publication Publication Date Title
EP3667924B1 (en) Signal comprising video data
CN111083476B (zh) 编码和解码视频数据的方法及视频数据编码器和解码器
JP7148739B2 (ja) 映像コーディングシステムにおいて文脈コーディングされたサインフラグを使用する映像デコーディング方法及びその装置
KR102416958B1 (ko) 픽처 데이터와 관련된 신택스 요소를 나타내는 이진 심볼들의 시퀀스를 컨텍스트 적응 이진 산술 코딩하기 위한 방법 및 디바이스
AU2023202899A1 (en) Method and device for entropy encoding, decoding video signal
WO2012011714A2 (ko) 다중 예측 필터를 이용하는 경쟁기반 인트라 예측 부호화/복호화 장치 및 방법
JP7282904B2 (ja) 映像コーディングシステムにおいてレジデュアル情報を使用する映像デコーディング方法及びその装置
KR20210033550A (ko) 영상 정보 시그널링 방법 및 장치와 이를 이용한 디코딩 방법 및 장치
WO2019103845A1 (en) Encoding and decoding methods and corresponding devices
CN114009049A (zh) 用于针对视频译码的低频不可分离变换信令的上下文建模
US20240179323A1 (en) Operation range extension for versatile video coding
WO2021137445A1 (ko) 비디오 신호 처리를 위한 변환 커널 결정 방법 및 이를 위한 장치
JP7260711B2 (ja) 映像コーディングシステムにおいてレジデュアルコーディング方法に対するフラグを使用する映像デコード方法及びその装置
KR20220131331A (ko) 사인 데이터 하이딩 관련 영상 디코딩 방법 및 그 장치
CN114467310A (zh) 图像编译系统中残差数据编译的图像解码方法及其装置
WO2010067973A2 (ko) 무손실 문맥적응적 이진산술부호화를 위한 h.264/avc 부호화기와 그 부호화 방법
WO2013162272A1 (ko) 비디오 신호 처리 방법 및 장치
JP7453347B2 (ja) 画像コーディングシステムで単純化されたレジデュアルデータコーディングを用いる画像デコード方法及びその装置
WO2013162283A1 (ko) 비디오 신호 처리 방법 및 장치
KR20220163419A (ko) 레지듀얼 코딩에 대한 영상 디코딩 방법 및 그 장치
CN117837144A (zh) 用于多功能视频编码的操作范围扩展
WO2022192902A1 (en) Remaining level binarization for video coding
WO2022217245A1 (en) Remaining level binarization for video coding
KR20220146565A (ko) 영상 코딩 시스템에서 레지듀얼 코딩에 대한 영상 디코딩 방법 및 그 장치
CN118158413A (zh) 用于多功能视频编码的操作范围扩展

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13781898

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 13781898

Country of ref document: EP

Kind code of ref document: A1