WO2013162283A1

WO2013162283A1 - 비디오 신호 처리 방법 및 장치

Info

Publication number: WO2013162283A1
Application number: PCT/KR2013/003513
Authority: WO
Inventors: 허진; 정지욱; 예세훈; 구문모; 김태섭; 성재원; 손은용
Original assignee: 엘지전자 주식회사
Priority date: 2012-04-24
Filing date: 2013-04-24
Publication date: 2013-10-31

Abstract

본 발명은 비트스트림으로부터 이진화 모드 정보와 양자화된 변환 계수를 얻고, 상기 이진화 모드 정보, 상기 양자화된 변환 계수 중 적어도 하나를 이용하여 차수 정보를 결정하고, 상기 차수 정보를 이용하여 제 2 이진화 부호어를 결정하고, 상기 제 2 이진화 부호어를 이용하여 엔트로피 디코딩을 수행하고, 상기 제 2 이진화 부호어는 제 1 이진화 부호어를 수정하여 결정되고, 상기 제 1 이진화 부호어는 상기 차수 정보를 이용하여 양자화된 변환 계수와 대응되는 부호어를 결정하는 것을 특징으로 하는 비디오 디코딩 방법이다. 본 발명은 효율적인 부호어의 결정을 통해 추가적인 메모리 필요가 발생하지 않아, 부호화, 복호화를 수행할 때 더 적은 비트를 부호화, 복호화하여 복잡도를 낮출 수 있다.

Description

비디오 신호 처리 방법 및 장치

본 발명은 비디오 신호의 코딩 방법 및 장치에 관한 것이다.

압축 부호화란 디지털화한 정보를 통신 회선을 통해 전송하거나, 저장 매체에 적합한 형태로 저장하는 일련의 신호 처리 기술을 의미한다. 압축 부호화의 대상에는 음성, 영상, 문자 등의 대상이 존재하며, 특히 영상을 대상으로 압축 부호화를 수행하는 기술을 비디오 영상 압축이라고 일컫는다. 다시점 비디오 영상의 일반적인 특징은 공간적 중복성, 시간적 중복성 및 시점간 중복성을 지니고 있는 점에 특징이 있다.

본 발명의 목적은 비디오 신호의 코딩 효율을 높이고자 함에 있다.

본 발명은 비디오 신호의 잔여 데이터의 특성을 고려하여 부호화, 복호화를 수행하도록 한다. 부호화, 복호화를 수행시 자주 코딩되는 양자화된 변환 계수가 작은 비트를 할당 받도록 부호어를 변형한다.

본 발명은 효율적인 부호어를 결정하여 추가적인 메모리 필요가 발생하지 않아, 부호화, 복호화를 수행할 때 더 적은 비트를 부호화, 복호화하여 복잡도를 낮출 수 있다.

도 1은 본 출원이 적용되는 일실시예로서, 비디오 디코더 장치의 개략적인 블록도를 도시한 것이다.

도 2는 본 출원이 적용되는 일실시예로서, 4X4 블록의 부호화 순서를 도시한 것이다.

도 3은 본 출원이 적용되는 일실시예로서, 양자화된 잔여 데이터의 부호화 단계 흐름도를 도시한 것이다.

도 4는 본 출원이 적용되는 일실시예로서, 제 2 이진화 부호어의 예를 도시한 것이다.

도 5는 본 출원이 적용되는 일실시예로서, 제 1 이진화 부호어의 예를 도시한 것이다.

도 6은 본 출원이 적용되는 일실시예로서, 이진화 부호어를 이용한 디코딩 방법 흐름도를 도시한 것이다.

본 발명은 비트스트림으로부터 이진화 모드 정보와 양자화된 변환 계수를 얻고, 상기 이진화 모드 정보, 상기 양자화된 변환 계수 중 적어도 하나를 이용하여 차수 정보를 결정하고, 상기 차수 정보를 이용하여 제 2 이진화 부호어를 결정하고, 상기 제 2 이진화 부호어를 이용하여 엔트로피 디코딩을 수행하고, 상기 제 2 이진화 부호어는 제 1 이진화 부호어를 수정하여 결정되고, 상기 제 1 이진화 부호어는 상기 차수 정보를 이용하여 양자화된 변환 계수와 대응되는 부호어를 결정합니다.

다시점 비디오 신호 데이터를 압축 부호화 또는 복호화하는 기술은 공간적 중복성, 시간적 중복성 및 시점간 존재하는 중복성을 고려하고 있다. 또한, 다시점 영상의 경우, 3차원 영상을 구현하기 위해 2개 이상의 시점에서 촬영된 다시점 텍스쳐 영상 및 이에 대응되는 다시점 뎁스 영상을 코딩해야 한다. 뎁스 영상을 코딩함에 있어서, 공간적 중복성, 시간적 중복성 또는 시점간 중복성을 고려하여 압축 코딩할 수 있음은 물론이다. 뎁스 영상의 각 샘플값은 카메라와 해당 화소 간의 거리 정보를 표현한 것이다. 또한, 본 명세서 내에서 뎁스 정보, 뎁스 데이터, 뎁스 픽쳐, 뎁스 시퀀스, 뎁스 코딩, 뎁스 비트스트림 등과 같은 용어들은 뎁스에 관련된 정보로 유연하게 해석될 수 있을 것이다. 코딩은 경우에 따라 인코딩 또는 디코딩으로 해석될 수 있고, 정보(information)는 값(values), 파라미터(parameter), 계수(coefficients), 성분(elements) 등을 모두 포함하는 용어로서, 경우에 따라 적절한 의미로 해석될 수 있다. ‘화면’ 또는 ‘픽쳐(picture)’는 일반적으로 특정 시간대의 하나의 영상을 나타내는 단위를 의미하며, ‘슬라이스(slice)’, ‘프레임(frame)’ 등은 실제 비디오 신호에의 코딩에 있어서 픽쳐의 일부를 구성하는 단위이기는 하나, 필요에 따라서는 서로 혼용되어 사용 될 수 있다. ‘픽셀(pixel)’, ‘화소’ 또는 ‘pel’은 하나의 영상을 구성하는 최소의 단위를 의미하는 것이다. 특정한 픽셀의 값을 나타내는 용어로써 ‘샘플(sample)’을 사용할 수 있다. 샘플은 휘도(Luma) 및 색차(Chroma) 성분으로 나누어질 수 있으나, 일반적으로는 이를 모두 포함하는 용어로써 사용되었다. 상기에서 색차 성분은 정해진 색상들간의 차이를 나타내는 것으로 일반적으로 Cb 및 Cr로 구성된다. '유닛(unit)'은 영상 처리의 기본 단위 또는 영상의 특정 위치를 지칭하는 의미로 사용되었으며, 경우에 따라서는 '블록(block)' 또는 '영역(area)' 등의 용어와 서로 혼용하여 사용될 수 있다. 다만 일반적인 경우에 있어서 블록은 M개의 열과 N개의 행으로 구성된 샘플들 또는 변환 계수(transform coefficient)들의 집합을 나타내는 용어로 사용된다.

본 발명의 일 실시예에 따른 인코딩 장치는 변환부, 양자화부, 역양자화부, 역변환부, 필터링부, 예측부 및/또는 엔트로피 코딩부 등을 포함하여 구성된다.

변환부는 입력 받은 비디오 신호에 대한 화소값을 변환하여 변환 계수값을 획득한다. 이러한 변환 방법으로는, 예를 들어, 이산 코사인 변환(DCT:Discrete Cosine Transform) 또는 웨이블릿 변환(Wavelet Transform) 등이 사용될 수 있다. 변환부에서는 입력된 영상 신호를 일정 크기의 유닛으로 나누어 변환을 수행하게 된다.

양자화부는 변환부에서 출력된 변환 계수 값을 양자화한다.

필터링부에서는 영상의 품질 개선을 위한 필터링 연산을 수행한다. 필터링부에서 사용되는 필터로는 예를 들어, 디블록킹 필터 및/또는 적응적 루프 필터 등이 포함될 수 있다. 프레임 저장부는 복원된 영상을 출력하거나 참조 영상으로 이용하기 위하여 저장한다.

코딩 효율을 높이기 위하여 영상 신호를 그대로 코딩하는 것이 아니라, 이미 코딩된 영역을 이용하여 영상을 예측하고, 예측된 영상에 원 영상과 예측 영상간의 레지듀얼 값을 더하여 복원 영상을 획득하는 방법이 사용된다. 영상을 예측하는 방법으로는 화면 내 예측 (intra prediction), 화면 간 예측 (inter prediction) 등이 사용될 수 있으며, 따라서 예측부는 인트라 예측부와 인터 예측부를 포함할 수 있다.

인트라 예측부는 현재 영상 내의 복원된 영역들로부터 화면내 예측을 수행하여, 화면내 부호화 정보를 엔트로피 코딩부에 전달한다. 인터 예측부에서는 프레임 저장부에 저장된 적어도 하나 이상의 참조 영상을 이용하여 현재 영상을 예측하고, 화면간 움직임 보상을 수행한다.

엔트로피 코딩부는 양자화된 변환 계수, 화면간 부호화 정보, 화면내 부호화 정보 및 인터 예측부로부터 입력된 참조 영역 정보 등을 엔트로피 코딩하여 비디오 신호 비트스트림을 생성한다. 엔트로피 코딩부에서는 가변 길이 코딩(VLC: Variable Length Coding) 방식과 산술 코딩(arithmetic coding) 등이 사용될 수 있다.

한편, 비디오 신호 디코딩 장치의 동작은 인코더에서의 동작에 대응되어 그 역과정을 수행할 수 있다.

도 1은 본 발명이 적용되는 일실시예로서, 비디오 디코더의 개략적인 블록도를 도시한 것이다.

본 발명의 실시예에 따른 디코딩 장치는 파싱부(100), 엔트로피 디코딩부(200), 역양자화부/역변환부(300), 필터링부(600), 인트라 예측부(400), 인터 예측부(500), 프레임 저장부(700) 등을 포함하여 구성된다.

파싱부(100)는 입력된 비트스트림을 복호화하기 위해 NAL 단위로 파싱을 수행한다. 입력된 비트스트림이 다시점 관련 데이터인 경우, 입력된 비트스트림은 카메라 파라미터를 포함할 수 있다. 카메라 파라미터에는 고유의 카메라 파라미터 및 비고유의 카메라 파라미터가 있을 수 있는데, 고유의 카메라 파라미터는 초점 거리, 가로세로비, 주점 등이 있을 수 있고, 비고유의 카메라 파라미터에는 세계 좌표계에서의 카메라의 위치정보 등이 있을 수 있다.

엔트로피 디코딩부(200)는 엔트로피 코딩의 역과정으로, 비디오 신호 비트스트림을 엔트로피 디코딩하여 부호화 타입, 각 영역에 대한 양자화된 변환 계수, 텍스쳐 픽쳐와 뎁스 픽쳐의 예측을 위한 코딩 정보 등을 추출할 수 있다.

역양자화/역변환부(300)에서는 양자화된 변환 계수에 양자화 파라미터를 적용하여 변환 계수를 획득하고, 변환 계수를 역변환하여 텍스쳐 데이터 또는 뎁스 데이터를 복원할 수 있다.

예측부는 마찬가지로 인트라 예측부(400) 및 인터 예측부(500)를 포함하고, 디코딩된 부호화 타입, 각 영역에 대한 변환 계수, 모션 벡터 등의 정보를 활용하여 예측 영상을 복원하게 된다. 인트라 예측부(400)에서는 현재 영상 내의 디코딩된 샘플로부터 화면내 예측 영상을 생성하게 된다. 또한, 상기 인터 예측부(500)는 프레임 저장부에 저장된 참조 영상을 이용하여 예측 영상을 생성하게 된다. 상기 인트라 예측부(400) 또는 인터 예측부(500)로부터 출력된 예측 영상에 역변환부로부터 복원된 각 화소에 대한 레지듀얼값이 더해져서 복원된 비디오 프레임이 생성된다.

한편, 필터링부(600)는 복원된 비디오 프레임에 대한 필터링을 수행하여 화질을 향상시킨다. 여기에는 블록 왜곡 현상을 감소시키기 위한 디블록킹 필터, 영상 전체의 왜곡 제거를 위한 적응적 루프 필터 등이 포함될 수 있다. 필터링을 거친 영상은 최종 영상으로 출력되고, 또한 다음 프레임에 대한 참조 영상으로 이용하기 위하여 프레임 저장부(700)에 저장된다.

DCT 계수나 모션 벡터와 높은 부호화 효율이 요구되는 정보들의 부호에서는 엔트로피 코딩(가변길이 부호화) 방식이 이용될 수 있다. 여기에서 입력되는 심볼들을 연속적인 코드워드로 변환하는데, 코드워드의 길이는 가변적일 수 있다. 예를 들어, 자주 발생하는 심볼들을 짧은 코드워드로 자주 발생하지 않은 심볼들은 긴 코드워드로 표현하는 것이다. 지수 골롬(Exponential Golomb)과 같은 기본적인 부호화 방법 외에 컨텍스트 기반 적응형 가변 길이 코딩(CAVLC: Context-based Adaptive Variable Length Coding), 컨텍스트 기반 적응형 산술 부호화(CABAC: Context-based Adaptive Binary Arithmetic Code) 등이 이용될 수 있다. 여기에서 컨텍스트-기반이란 주위의 상황에 따라 보다 효율이 좋은 부호화 방식을 적응적으로 선택한다는 의미이다.

한편, 본 발명에서는 복잡도 및 효율을 고려하여 엔트로피 코딩 방식을 선택할 수 있다. 예를 들어, 낮은 복잡도를 원하는 경우 저복잡도 엔트로피 코딩(Low complexity entropy coding, LCEC) 코딩을, 높은 효율을 원할 때에는 컨텍스트 기반 적응형 산술 부호화을 이용하는 것이다.

저복잡도 엔트로피 코딩 를 사용할 때에는 기본적으로 각 신택스 성분(syntax element)을 10개의 기 결정된 가변길이 코딩 표를 이용한다. 각 가변길이 코딩 표는 여러 가지 확률분포에 맞게 정해져 있다. 먼저 각 신택스 성분을 각각에 맞는 가변길이 코딩 표를 이용하여 코드 번호를 얻어낸다. 이 코드 번호와 각각에 맞는 분류표를 사용하여 각 신택스의 표 인덱스를 얻을 수 있고, 이 표 인덱스는 각각의 부호의 값으로 매핑된다. 분류표란 각 부호의 부호어를 적응적으로 조절하기 위한 것이다.

비디오 압축 표준에서는 변환과 양자화 과정 후, 잔여 데이터를 효율적으로 부호화하기 위해 엔트로피 부호기로 문맥 기반 적응적 이진 산술 부호화(context-based adaptive binary arithmetic coding, CABAC)를 사용할 수 있다. 디코딩 장치의 엔트로피 디코딩부에서도 문맥 기반 적응적 이진 산술 부호화를 사용할 수 있다.

이하에서는 본 출원에서 제안하는 엔트로피 코딩 방법에 대해서 설명하기로 한다.

본 발명의 실시예로서, 잔여 데이터의 레벨 값을 효율적인 부호화를 위해 절삭된 골롬-라이스 부호어를 사용 수 있다. 하지만, 기존의 절삭된 골롬-라이스 부호어는 비디오 부호화에서 잔여 데이터의 특성을 고려하지 않고 설계되어 부호화 효율에 한계가 있다. 따라서 제안하는 방법은 비디오 부호화에서 잔여 데이터의 특성을 고려하여 기존의 절삭된 골롬-라이스 부호어를 변형하여 비디오 부호화의 효율을 높인다.

문맥 기반 적응적 이진 산술 부호화의 잔여 데이터 부호화 순서는 다음과 같다. 먼저 현재 변환 단위 (transform unit, TU) 크기에서 마지막 0이 아닌 계수의 x 위치와 y 위치를 각각 독립적으로 부호화한 후, 부호화된 마지막 0이 아닌 계수의 위치까지 0이 아닌 계수들의 위치를 각각 부호화한다. 마지막으로 0이 아닌 계수의 절대값과 부호를 부호화한다. 각 부호화 순서의 자세한 내용은 다음과 같다.

먼저 양자화 변환 후, 현재 변환 단위 크기에서 마지막 0이 아닌 계수의 x와 y위치를 단항 이진부호화를 사용하여 독립적으로 부호화한다. 예를 들어, 마지막 0이 아닌 계수의 (x, y) 위치는 (2, 1)이다. 따라서, x와 y 각각의 위치를 아래 표의 단항 이진부호화를 사용하여 부호화한다. 그 결과, x는 001로 y는 01로 부호화된다.

마지막 0이 아닌 계수의 위치를 부호화한 다음, 각 0이 아닌 계수의 위치 정보를 부호화한다. 마지막 0이 아닌 계수의 위치까지 각 스캔 위치에서 계수의 값이 0인지 아닌지에 대한 정보를 각각 부호화한다. 즉, 현재 스캔 위치에서 계수의 값이 0이면 0으로, 0이 아니면 1로 부호화를 수행한다.

다음으로 4x4 블록 단위로 각 0이 아닌 계수의 절대 값과 부호를 부호화한다. 현재 변환 단위의 크기가 4x4 블록 크기보다 큰 경우, 4x4 블록의 부호화 순서는 지그재그 스캔 순서에 따라 수행된다.

도 2는 본 출원이 적용되는 일실시예로서, 변환 단위의 크기가 4x4 블록 크기보다 큰 경우에 각 4x4 블록의 부호화 순서를 나타낸다. 도 2에서 subBN (N=0, 1, 2, 3, ..)은 각 4x4 블록을 나타낸다. 각 4x4 블록에서 0이 아닌 계수의 부호화는 역 지그재그 스캔 순서에 따라 수행된다. 예를 들어, 마지막 0이 아닌 계수가 subB4 블록 내에 존재한다면, 먼저 subB0 블록 내에서 0이 아닌 계수를 역 지그재그 스캔 순서에 따라 부호화한다. 다음으로 subB1 블록 내에서 다시 0이 아닌 계수를 역 지그재그 스캔 순서에 따라 부호화한다. 동일한 방법으로 subB2, subB3, subB4에서 0이 아닌 계수를 부호화한다.

도 3는 본 출원이 적용되는 일실시예로서, 잔여 데이터 계수의 부호화 단계의 흐름도와 신택스 요소를 나타낸다.

각 4x4 블록 내에서 역 지그재그 스캔 순서(Scan_pos)에 따라 각 스캔 위치에서 잔여 데이터의 계수(Coefficients)의 절대 값과 부호를 부호화한다.

각 스캔 위치에서 잔여 데이터의 계수 값이 0인지 아닌지 여부를 부호화(significantFlag)한다(S100). 만약 계수 값이 0이면 significantFlag는 0으로, 만약 계수의 값이 0이 아니면 1로 부호화한다.

다음으로 잔여 데이터의 계수의 절대값이 1보다 큰지 여부를 부호화(gr1Flag(coeff_abs_level_greater1_flag))한다(S120). 잔여 데이터의 계수의 절대값이 1이면 gr1Flag는 0으로, 1보다 크면 gr1Flag는 1로 부호화한다.

gr1Flag는 1인 경우, 다시 잔여 데이터의 계수의 절대값이 2보다 큰지 여부를 부호화(gr2Flag(coeff_abs_level_greater2_flag))한다(S140). 잔여 데이터의 계수의 절대값이 2이면 gr2Flag는 0으로, 2보다 크면 gr2Flag는 1로 부호화한다.

gr2Flag 값이 1인 경우, 현재 부호화하고자 하는 계수의 절대 값에서 3을 뺀 값(levelRem(coeff_abs_level_remaining))을 이진화 부호어를 사용하여 부호화한다(S160).

즉, 양자화된 변환 계수의 절대 값이 1 또는 2인 경우는 두 신택스 요소 gr1Flag와 gr2Flag를 사용하여 부호화를 수행하고, 2보다 큰 경우에 대해서는 이진화 부호어를 사용하여 부호화를 수행한다. 이진화 부호어에 대해서는 도 4, 도 5 그리고 도 6에서 자세히 설명하기로 한다,

마지막으로 계수의 부호를 부호화(coeff_sign_flag)한다(S180).

도 4는 본 출원이 적용되는 일 실시예로, 제 1 이진화 부호어의 예를 나타낸 것이다.

제 1 이진화 부호어는 부호화 대상을 이진화 하기 위한 부호어이다. 부호화 대상은 양자화된 변환 계수의 절대 값에서 3을 뺀 값일 수 있다.

제 1 이진화 부호어에 관한 정보는 부호어 대상과 대응되는 이진화 부호어와 비트수를 포함할 수 있다. 부호어 대상과 대응되는 이진화 부호어는 부호어 대상과 차수 정보로부터 결정될 수 있다. 그리고 비트수는 이진화 부호어로부터 결정될 수 있다.

제 1 이진화 부호어의 차수가 0인 경우(k=0), 부호화 하려는 값이 0인 경우 비트수가 1인 0으로, 부호화 하려는 값이 1인 경우, 비트수가 2인 10으로, 부호화하려는 값이 2인 경우, 비트수가 3인 110의 규칙으로 이진화 부호화를 한다. 부호화 하려는 값이 커질수록 필요한 비트수가 늘어나게 된다.

제 1 이진화 부호어의 차수가 1인 경우(k=1), 부호화 하려는 값이 0인 경우 비트수가 2인 00으로, 부호화하려는 값이 1인 경우 비트수가 2인 01로, 부호화 하려는 값이 2인 경우 비트수가 3인 100의 규칙으로 이진화 부호화를 한다. 차수가 0인 경우와 비교하여 부호화하려는 값이 0인 경우에는 많은 비트수를 갖지만, 부호화하려는 값이 3이상인 경우에는 오히려 적은 비트수를 갖게 된다.

제 1 이진화 부호어의 차수가 2인 경우(k=2), 부호화 하려는 값이 0인 경우 비트수가 3인 000으로, 부호화하려는 값이 3인 경우 비트수가 3인 011로, 부호화 하려는 값이 4인 경우 비트수가 1000의 규칙으로 이진화 부호화를 한다. 차수가 1인 경우와 비교하여 부호화하려는 값이 0,1인 경우에는 많은 비트수를 갖지만, 부호화하려는 값이 6이상인 경우에는 오히려 적은 비트수를 갖게 된다.

제 1 이진화 부호어의 차수가 3인 경우(k=3), 부호화 하려는 값이 0인 경우 비트수가 4인 0000으로, 부호화하려는 값이 7인 경우 비트수가 4인 0111으로, 부호화하려는 값이 8인 경우 비트수가 5인 10000의 규칙으로 이진화 부호화를 한다. 차수가 2인 경우와 비교하여 부호화하려는 값이 0,1,2,3인 경우에는 많은 비트수를 갖지만, 부호화하려는 값이 12이상인 경우에는 오히려 적은 비트수를 갖게 된다.

제 1 이진화 부호어에서 높은 차수를 가진 경우에 부호화 하려는 값이 작으면 낮은 차수보다 많은 비트수를 사용할 수 있다. 그러나, 부호화 하려는 값이 큰 경우에는 오히려 적은 비트수를 사용하므로 부호화 하려는 값이 큰 경우 높은 차수의 부호어를 사용할 때 효율적인 코딩을 할 수 있다.

제 1 이진화 부호어를 사용하여 2보다 큰 계수 값을 부호화하는 coeff_abs_level_remaining 부호화를 수행한다. 현재 부호화한 계수의 절대 값에 따라 제 1 이진화 부호어의 차수를 단조 증가시키면서 업데이트한 후, 업데이트 된 제 1 이진화 부호어를 사용하여 다음 계수의 절대 값을 부호화한다. 제 1 이진화 부호어의 차수 증가 조건은 아래와 같다.

여기서, k_t는 현재 제 1 이진화 부호어 차수를 나타내고, k_t+1은 다음 부호화에서 사용할 제 1 이진화 부호어 차수를 나타낸다. value_t는 현재 양자화된 변환 계수에서 3을 뺀 값을 나타낸다. 제 1 이진화 부호어의 차수는 현재 양자화된 변환 계수에서 3을 뺀 값과 현재 제 1 이진화 부호어 차수를 이용하여 증가여부를 판단할 수 있다.

제 1 이진화 부호어는 0차 제 1 이진화 부호어를 사용하여 부호화를 시작하여 점차 차수를 단조 증가시키면서 부호화를 수행한다. 제 1 이진화 부호어 방법은 다음에 부호화할 계수의 절대 값이 현재 부호화한 계수의 절대 값보다 크다는 가정을 전제로 한다.

그러나, 제 1 이진화 부호어를 살펴보면 이러한 가정을 고려하여 적합하게 설계되어 있지 않다. 즉, 차수가 0인(k=0) 제 1 이진화 부호어에서 차수가 1인(k=1) 제 1 이진화 부호어로 부호표가 업데이트가 되었다는 의미는 다음에 부호화할 coeff_abs_level_remaining 값이 최소한 0 또는 1보다는 크다는 것을 가정한다는 것이다. 따라서, 차수가 1인(k=1) 제 1 이진화 부호어에서는 절대 값이 0과 1보다는 2와 3에 더 적은 비트를 할당해야 한다. 동일한 방법으로 차수가 1인 (k=1)제 1 이진화 부호어에서 차수가 2인(k=2) 제 1 이진화 부호어로 부호표가 업데이트가 된다면, 차수가 2인(k=2) 제 1 이진화 부호어를 사용하여 부호화할 가능성이 높은 절대 값 영역에 더 적은 비트를 할당해야 한다. 즉, 4보다 큰 coeff_abs_level_remaining 값에 더 적은 비트를 할당해야 한다는 의미이다.

그러나, 실제로는 coeff_abs_level_remaining 값은 저주파에서 고주파로 가면서 계속 증가하지만은 않는다. 증가할 수도 있지만 감소할 수도 있다. 따라서, 제안하는 방법에서는 이러한 특성도 고려하여 제 2 이진화 부호어를 설계한다.

제안하는 제 2 이진화 부호어는 제 1 이진화 부호어의 0차, 1차, 2차 부호어에서 제 1 이진화 부호어의 차수를 증가시키는 경계선 영역에 더 적은 비트를 할당한다. 예를 들어, 차수가 0인(k=0) 제 1 이진화 부호어를 사용하여 부호화를 수행할 때, coeff_abs_level_remaining 값이 1보다 크면 차수가 0인(k=0) 제 1 이진화 부호어를 차수가 1인(k=1) 제 1 이진화 부호어로 업데이트하고 이를 이용하여 다음 coeff_abs_level_remaining 값을 부호화한다. 따라서, 제안하는 변형된 제 1 이진화인 제 2 이진화 부호어에서는 업데이트가 발생하는 절대 값을 기준으로 하여 주변에 더 적은 비트를 할당하고 기준이 되는 절대 값에서 멀어짐에 따라 더 많은 비트를 할당하도록 새로이 제 2 이진화 부호어를 설계한다.

도 5는 본 출원이 적용되는 일실시예로, 제 2 이진화 부호어의 예를 나타낸 것이다.

제 2 이진화 부호어는 부호화 대상을 이진화 하기 위한 부호어이다. 부호화 대상은 양자화된 변환 계수의 절대 값에서 3을 뺀 값일 수 있다. 제 2 이진화 부호어를 살펴보면 각 차수의 이진화 부호어에서 부호화 효율을 높이기 위해 업데이트가 발생하는 영역을 기준으로 주위에 더 적은 비트를 할당하도록 설계하고, 업데이트가 발생하는 영역에서 멀어짐에 따라 더 많은 비트를 할당하도록 설계한다. 제 2 이진화 부호어는 제 1 이진화 부호어를 수정하거나, 변형하여 설계할 수 있다. 제안하는 방법은 제 1 이진화 부호어를 변형하므로 추가적인 메모리 필요가 발생하지 않고 부/복호화를 수행할 때 더 적은 비트를 부/복호화하여 복잡도를 낮출 수 있다.

제 2 이진화 부호어의 차수 조건은 제 1 이진화 부호어의 차수 조건과 동일 할 수 있다.

제 2 이진화 부호어에 관한 정보는 부호어 대상과 대응되는 이진화 부호어와 비트수를 포함할 수 있다. 부호어 대상과 대응되는 이진화 부호어는 부호어 대상과 차수 정보로부터 결정될 수 있다. 그리고 비트수는 이진화 부호어로부터 결정될 수 있다.

1보다 큰 부호화 대상이 많은 경우, 차수를 1로 증가하여 부호어 대상을 이진화 할 수 있다. 2보다 큰 부호화 대상이 많은 경우, 차수를 2로 증가하여 부호어 대상을 이진화 할 수 있다. 5보다 큰 부호화 대상이 많은 경우, 차수를 3으로 증가하여 부호어 대상을 이진화 할 수 있다.

제 2 이진화 부호어의 차수 정보가 1인 경우(k=1)에는, 부호화 하려는 값이 0인 경우에 비트수가 3인 100으로, 부호화 하려는 값이 1인 경우에 비트수가 2인 00으로, 부호화 하려는 값이 2인 경우에 비트수가 2인 01로 제 1 이진화 부호어를 재조정할 수 있다.

제 2 이진화 부호어의 차수 정보가 2인 경우(k=2)에는 부호화 하려는 값이 0인 경우에 비트수가 4인 1000으로, 부호화 하려는 값이 1인 경우에 비트수가 4인 1001로, 부호화 하려는 값이 2인 경우에 비트수가 3인 000으로, 부호화 하려는 값이 3인 경우에 비트수가 3인 001로, 부호화 하려는 값이 4인 경우에 비트수가 3인 010으로, 부호화 하려는 값이 5인 경우에 비트수가 3인 1001로 제 1 이진화 부호어를 재조정할 수 있다.

제 2 이진화 부호어의 차수 정보가 3인 경우(k=3)에는 부호화 하려는 값이 0인 경우에 비트수가 5인 10000으로, 부호화 하려는 값이 1인 경우에 비트수가 5인 10001로, 부호화 하려는 값이 2인 경우에 비트수가 5인 10010으로, 부호화 하려는 값이 3인 경우에 비트수가 5인 10011로, 부호화 하려는 값이 4인 경우에 비트수가 5인 10100으로, 부호화 하려는 값이 8인 경우에 비트수가 4인 0000으로, 부호화 하려는 값이 9인 경우에 비트수가 4인 0001로, 부호화 하려는 값이 10인 경우에 비트수가 4인 0010로, 부호화 하려는 값이 11인 경우에 비트수가 4인 0011로, 부호화 하려는 값이 12인 경우에 비트수가 4인 0100으로 제 1 이진화 부호어를 재조정할 수 있다.

도 6은 본 출원이 적용되는 일실시예로, 제 2 이진화 부호어를 이용한 디코딩 방법의 흐름도를 도시한 것이다.

비트스트림을 수신하면, 비트스트림으로부터 이진화 모드 정보를 획득한다(S200). 이진화 모드 정보는 비디오 신호가 어떠한 이진화 모드에 의해 생성되었는지를 나타내는 정보이다. 이진화 모드에는 제 1 이진화 부호어, 제 2 이진화 부호어 등이 있을 수 있다.

양자화된 변환 계수를 이용하여 차수 정보를 결정한다(S210). 차수 정보는 이진화 부호어의 차수를 나타내는 정보이다. 차수 정보는 양자화된 변환 계수, 현재 차수 정보 중 적어도 하나를 이용하여 결정될 수 있다.

차수 정보를 이용하여 양자화된 변환 계수에 대응되는 부호어를 결정할 수 있다(S220). 차수 정보가 결정되면 각 양자화된 변환 계수의 이진화 부호어가 결정된다.

결정된 부호어를 이용하여 엔트로피 디코딩을 수행한다(S230).

이상에서 설명한 바와 같이, 본 발명이 적용되는 디코딩/인코딩 장치는 DMB(Digital Multimedia Broadcasting)과 같은 멀티미디어 방송 송/수신 장치에 구비되어, 비디오 신호 및 데이터 신호 등을 디코딩하는데 사용될 수 있다. 또한 상기 멀티미디어 방송 송/수신 장치는 이동통신 단말기를 포함할 수 있다.

또한, 본 발명이 적용되는 디코딩/인코딩 방법은 컴퓨터에서 실행되기 위한 프로그램으로 제작되어 컴퓨터가 읽을 수 있는 기록 매체에 저장될 수 있으며, 본 발명에 따른 데이터 구조를 가지는 멀티미디어 데이터도 컴퓨터가 읽을 수 있는 기록 매체에 저장될 수 있다. 상기 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 저장 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어, 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한, 상기 인코딩 방법에 의해 생성된 비트스트림은 컴퓨터가 읽을 수 있는 기록 매체에 저장되거나, 유/무선 통신망을 이용해 전송될 수 있다.

본 발명은 비디오 신호를 코딩하는데 이용될 수 있다.

Claims

비트스트림으로부터 이진화 모드 정보와 양자화된 변환 계수를 얻는 단계;

상기 이진화 모드 정보, 상기 양자화된 변환 계수 중 적어도 하나를 이용하여 차수 정보를 결정하는 단계;

상기 차수 정보를 이용하여 제 2 이진화 부호어를 결정하는 단계;

상기 제 2 이진화 부호어를 이용하여 엔트로피 디코딩을 수행하는 단계; 를 포함하고,

상기 제 2 이진화 부호어는 제 1 이진화 부호어를 수정하여 결정되고,

상기 제 1 이진화 부호어는 상기 차수 정보를 이용하여 양자화된 변환 계수와 대응되는 부호어를 결정하는 것을 특징으로 하는 비디오 디코딩 방법.
제 1항에 있어서,

상기 제 2 이진화 부호어는 상기 차수 정보가 1인 경우, 제 1 이진화 부호어의 상기 양자화된 변환 계수의 절대값이 0인 경우와 2인 경우의 부호어를 바꾸는 것을 특징으로 하는 비디오 디코딩 방법.
제 1항에 있어서,

상기 제 2 이진화 부호어는 상기 차수 정보가 2인 경우, 제 1 이진화 부호어의 상기 양자화된 변환 계수의 절대값이 0인 경우와 4인 경우의 부호어를 바꾸고, 제 2 이진화 부호어의 상기 양자화된 변환 계수의 절대값이 1인 경우와 5인 경우의 부호어를 바꾸는 것을 특징으로 하는 비디오 디코딩 방법.
제 1항에 있어서,

상기 제 2 이진화 부호어는 상기 차수 정보가 3인 경우, 제 1 이진화 부호어의 상기 양자화된 변환 계수의 절대값이 0인 경우와 8인 경우의 부호어를 바꾸고, 제 2 이진화 부호어의 상기 양자화된 변환 계수의 절대값이 1인 경우와 9인 경우의 부호어를 바꾸고, 제 2 이진화 부호어의 상기 양자화된 변환 계수의 절대값이 2인 경우와 10인 경우의 부호어를 바꾸고, 제 2 이진화 부호어의 상기 양자화된 변환 계수의 절대값이 3인 경우와 11인 경우의 부호어를 바꾸고, 제 2 이진화 부호어의 상기 양자화된 변환 계수의 절대값이 4인 경우와 12인 경우의 부호어를 바꾸는 것을 특징으로 하는 비디오 디코딩 방법.
비트스트림으로부터 이진화 모드 정보와 양자화된 변환 계수를 얻는 파싱부;

상기 이진화 모드 정보, 상기 양자화된 변환 계수 중 적어도 하나를 이용하여 차수 정보를 결정하고, 상기 차수 정보를 이용하여 제 2 이진화 부호어를 결정하고, 상기 제 2 이진화 부호어를 이용하여 엔트로피 디코하는 엔트로피 디코딩부; 및

상기 제 2 이진화 부호어를 제 1 이진화 부호어를 수정하여 결정하고, 상기 차수 정보를 이용하여 양자화된 변환 계수와 대응되는 부호어를 결정하는 제 1 이진화 부호어를 결정하는 상기 엔트로피 디코딩부를 포함하는 것을 특징으로 하는 비디오 디코딩 장치.
제 5항에 있어서,

상기 제 2 이진화 부호어는 상기 차수 정보가 1인 경우, 제 1 이진화 부호어의 상기 양자화된 변환 계수의 절대값이 0인 경우와 2인 경우의 부호어를 바꾸는 것을 특징으로 하는 비디오 디코딩 장치.
제 5항에 있어서,

상기 제 2 이진화 부호어는 상기 차수 정보가 2인 경우, 제 1 이진화 부호어의 상기 양자화된 변환 계수의 절대값이 0인 경우와 4인 경우의 부호어를 바꾸고, 제 2 이진화 부호어의 상기 양자화된 변환 계수의 절대값이 1인 경우와 5인 경우의 부호어를 바꾸는 것을 특징으로 하는 비디오 디코딩 장치.
제 5항에 있어서,

상기 제 2 이진화 부호어는 상기 차수 정보가 3인 경우, 제 1 이진화 부호어의 상기 양자화된 변환 계수의 절대값이 0인 경우와 8인 경우의 부호어를 바꾸고, 제 2 이진화 부호어의 상기 양자화된 변환 계수의 절대값이 1인 경우와 9인 경우의 부호어를 바꾸고, 제 2 이진화 부호어의 상기 양자화된 변환 계수의 절대값이 2인 경우와 10인 경우의 부호어를 바꾸고, 제 2 이진화 부호어의 상기 양자화된 변환 계수의 절대값이 3인 경우와 11인 경우의 부호어를 바꾸고, 제 2 이진화 부호어의 상기 양자화된 변환 계수의 절대값이 4인 경우와 12인 경우의 부호어를 바꾸는 것을 특징으로 하는 비디오 디코딩 장치.