KR100744435B1

KR100744435B1 - 고속 동영상 압축을 위한 ｄｃｔ 및 양자화 과정 생략 방법

Info

Publication number: KR100744435B1
Application number: KR1020060016783A
Authority: KR
Inventors: 송원선; 홍민철; 이승호
Original assignee: (주)씨앤에스 테크놀로지
Priority date: 2006-02-21
Filing date: 2006-02-21
Publication date: 2007-08-01

Abstract

본 발명은 DCT 및 양자화 과정 생략을 통해 계산량을 감소시킬 수 있는 고속 동영상 압축을 위한 개선된 DCT 및 양자화 과정 생략 방법에 관한 것으로, DCT 계수들의 이론적 분석을 통하여 모든 DCT 계수값들이 '0'으로 양자화되는 보다 더 정확한 충분조건을 유도함으로써 DCT 및 양자화 과정 생략을 통해 계산량을 감소시킬 수 있도록 하며, 본 발명에 따르면 모든 DCT 계수값들이 '0'으로 양자화되는 충분조건은

가 된다.

DCT, 양자화, 변환 계수, 계산량, H.264, 생략

Description

고속 동영상 압축을 위한 ＤＣＴ 및 양자화 과정 생략 방법 {An Improved Early Detection of all-zero DCT Coefficients for Fast Video Encoding}

도 1은 H.264 부호화기의 구조를 보여주는 블록도이다.

도 2는 본 발명에서 제안하고 있는 고속 동영상 압축을 위한 DCT 및 양자화 과정 생략 방법의 전체 흐름도이다.

본 발명은 H.264 동영상 표준 부호화 방식(이하, H.264라고 약칭함)에 관한 것으로, 특히 DCT 및 양자화 과정 생략을 통해 계산량을 감소시킬 수 있는 고속 동영상 압축을 위한 개선된 DCT 및 양자화 과정 생략 방법에 관한 것이다.

H.264는 MPEG-4 Part 10 (AVC)라고도 불리우며, ITU-T & ISO/IEC Joint Video Team에서 승인된 국제 동영상 압축 표준으로 뛰어난 압축 효율과 에러에 강하고 네트워크 적응성이 뛰어나다는 장점을 지니고 있다.

최신의 동영상 압축 표준인 H.264는 정수형 DCT(Discrete Cosine Transform), 변환 블록 크기의 움직임 추정 및 보상(variable block size motion estimation and compensation), 양자화(quantization), 엔트로피 부호화 등으로 구 성되어 있다. 이 중에서 움직임 추정 및 보상, DCT/IDCT은 실제 구현시 많은 계산량과 부가적인 메모리가 요구되는 것으로 알려져 있다. 특히, MPEG-4에 대하여 2배의 압축 성능을 지니는 H.264에서는 보다 많은 계산량이 사용된다.

현재 고속 동영상 압축을 위하여 DCT 및 양자화 과정에서의 계산량 감소에 관한 많은 연구가 진행되고 있다. 일반적인 동영상 압축 부호화기에서는 예측 오차 블록의 DCT 계수들 모두가 '0'으로 양자화될 때의 특정 상태를 나타내는 신호만을 복호화기로 전송한다. 이것은 각 계수값 대신에 특정 부호만을 전송하기 때문에 압축 효율을 보다 향상시킬 수 있는 장점을 제공한다. 그러나, 이러한 특정 상태는 DCT 및 양자화 과정을 거친 후에야 비로소 판정할 수 있다. 따라서, DCT 및 양자화 과정 이전에 미리 이러한 상태를 예측할 수 있다면 불필요한 DCT 및 양자화 과정은 생략될 수 있으므로 이에 따른 많은 계산량과 부가적인 메모리를 줄일 수 있다.

이에 관한 연구들에는 Zhou Xuan 등의 "Method for detecting all-zero DCT coefficients ahead of discrete cosine transformation and quantisation", Electronics Letters, Vol.34, No.19, pp.1839-1840, Sept. 1998; L.A Sousa의 "General method for eliminating redundant computations in video coding", Electronics Letters, Vol.36, No.4, pp.306-307, Feb. 2000; Shi Jun 등의 " Efficient method for early detection of all-zero DCT confficients", Electronics Letters, Vol.37, No.3, pp.160-161, Feb. 2001; 문용호의 " 고속 비디오 코딩을 위한 효율적인 DCT 계산 방식" 한국 통신 학회 논문지, Vol.27, No.9A, pp.908-915, Sept. 2002 등이 있다.

본 발명은 상기한 문제점을 해결하기 위해 안출된 것으로, 본 발명의 목적은 DCT 계수들의 이론적 분석을 통하여 모든 DCT 계수값들이 '0'으로 양자화되는 보다 더 정확한 충분조건을 유도함으로써 고속 부호화가 가능한 고속 동영상 압축을 위한 DCT 및 양자화 과정 생략 방법을 제공하는 것이다.

상기한 목적을 달성하기 위한 본 발명의 고속 동영상 압축을 위한 DCT 및 양자화 과정 생략 방법은, H.264에서의 동영상 부호화 방법에 있어서, 정수 변환된 최대 DCT 계수값(

)를 탐색하는 단계와; 상기 정수 변환된 최대 DCT 계수값(

)이 소정의 임계값 보다 작은 경우에는 DCT 및 양자화 과정을 생략하는 단계를 포함하는 것을 특징으로 한다.

이하 첨부된 도면을 참조하여 본 발명의 바람직한 실시예에 대해 상세히 설명한다.

먼저, H.264의 부호화기 전체 구조 중에서 정수 변환, 양자화, 정수 역변환, 역양자화의 구조에 대하여 기술하고 DCT 계수들의 이론적 분석을 통하여 모든 DCT 계수값들이 '0'으로 양자화되는 보다 더 정확한 충분조건을 유도하는 과정에 대해 기술한다.

도 1은 H.264 부호화기의 구조를 보여주는 블록도로서, 입력된 영상 데이터의 각각의 매크로블록(Macroblock)은 인트라모드(Intra Mode)와 인터모드(Inter Mode)로 부호화 되어진다. 인트라모드는 입력된 영상 데이터로부터 구성되어지며, 인터모드는 재구성된 기준 영상(Reference Frame)을 이용하여 움직임 추정(ME)과 움직임 보정 (MC)에 의하여 구성되어진다. 각 모드에 의해 생성된 값과 입력된 영상 데이터와의 차로 생성된 레지듀얼(Residual) 매크로블록은 정수 변환과 양자화를 거쳐 양자화된 변환 계수로 변환되며 엔트로피 코딩(Entropy Coding)을 거치게 된다. 그와 동시에 생성된 양자화된 변환 계수는 다시 역양자화와 정수 역변환을 거치고 인트라모드 또는 인터모드로 형성된 값과 더하여진 후 필터를 거쳐 기준 영상으로 사용된다. 이러한 부호화 과정 중에서 도 1에 점선으로 표시된 부분이 본 발명과 관련된 정수 변환, 양자화, 역양자화, 정수 역변환 구조이다.

H.264는 MPEG-1, MPEG-2, MPEG-4, H.261, H.263과 같은 기존의 다른 표준 부호화 방식과는 서로 상이한 구조를 가지는데, 최소 4x4 단위까지 움직임 보상의 수행이 가능하고, 움직임 보상을 하는데 사용하는 참조 프레임으로 다수의 참조 프레임을 사용하여 예측 부호화할 수 있고, 1/2화소 단위였던 움직임 벡터가 1/4화소 단위의 움직임 벡터로 정밀도가 높아졌으며, 정수형 변환에 의하여 DCT가 정수 단위로 수행되어 기존의 DCT 변환, 역변환시 발생하는 부동소수점 단위의 오류가 제거되었다는 주된 특징을 갖는다. 참고로, 표 1은 H.264와 MPEG-4 Part 2의 주요 특징을 서로 비교해 본 것이다.

본 발명에서는 DCT 및 양자화 과정 후 변환 과정을 거친 계수 값들이 모두 '0'이 되는 조건을 이용해 두 과정을 생략하여 계산량을 효과적으로 절감 시킬 수 있도록 한다.

기존의 DCT 및 양자화 과정을 이용한 계산량 절감은 다음과 같은 식을 이용하여 DCT 계수 값들이 '0'으로 양자화되는 충분 조건을 이론적으로 유도할 수 있다.

(1)

(2)

위의 식 (1)과 (2)에서,

는 각각 DCT 계수, 원 화소 값, 그리고 양자화 매개변수를 나타내며, 괄호 안의

는 각 방향에 대한 화소의 위치를 나타낸다.

위의 식 (2)와 같은 기존의 동영상 부호화 방식들과 유사한 형태로 H.264의 변환 과정과 양자화 과정은 식 (3)과 같은 매트릭스 형태의 수식으로 표현할 수 있다.

(3)

위의 식 (3)에서,

는 양자화 된 계수를 나타내고,

는 H.264의 정수 변환만을 거친 계수이며,

은 H.264 동영상 표준 부호화 방식에서의 실제 양자화 값으로, 기존의 양자화 파라미터(QP)는 H.264에서 색인(index)으로만 사용된다. PF는 포스트 스케일링 요소(post scaling factor)를 나타낸다. 4x4 블록 화소의 각 위치에 따른 PF는 다음과 같은 표 2로 나타내어질 수 있다.

위의 식 (3)에서,

은 H.264의 참조 모델(reference model)에서 곱셈과 우측 이동연산(right shift)을 이용해 나눗셈 연산을 피하고 정수 보정을 위하여 MF(multiplication factor)라는 요소를 이용해 다음과 같은 식 (4)로 표현하였다.

(4)

정수 보정을 위한 요소들, MF는 각 화소의 위치에 따라 다음의 표 3과 같이 표현할 수 있다.

따라서, H.264의 변환 및 양자화 과정으로부터 4x4 크기의 블록이 양자화 과정까지의 수행 후 '0'이 되기 위한 조건은 식 (2)를 이용하여 다음의 식 (5)와 같은 형태로 나타낼 수 있다.

(5)

위의 식 (5)에서,

는 4x4 크기의 블록이 변환 및 양자화된 계수이다.

또한, 위의 식 (3)과 식 (4)로부터

에 의한 임계치를 유도할 수 있다.

(6)

(7)

위의 식 (7)을 식 (5)에 대입하여 블록이 '0'이기 위한 조건은 다음과 같은 식 (8)으로 나타낼 수 있다.

(8)

마지막으로, 식 (8)에 식 (7)을 대입하여 정리하면, 다음과 같은 임계치로 유도하여 정리할 수 있다.

(9)

위의 식 (9)는 모든 DCT 계수값들이 '0'으로 양자화되는 충분조건이 된다. 식 (9)의 충분조건을 이용하여 H.264의 정수 변환된 최대 계수값이 우변의 임계치보다 작은 경우에는 그 블록이 '0'이 되므로 실제 변환 과정과 양자화 과정을 거치지 않고 바로 부호화 되며, 우변의 임계치보다 큰 경우에는 변환 과정과 양자화 과정 모두 수행하게 된다.

도 2를 참조하면, 정수 변환된 최대 DCT 계수값(

)를 탐색하고(S100), 정수 변환된 최대 DCT 계수값(

)이 위의 식들에 의해 결정된 임계치에 따라서 조건이 만족하는지 판단한다(S110). 만약 조건을 만족하는 경우에는 DCT, 양자화, 역양자화, IDCT 과정을 수행하지 않고 곧바로 엔트로피 부호화 과정을 수행하게 된다(S120 및 S140). 이와 반대로, 임계치 조건에 만족하지 않는 경우에는 기존의 동영상 압축 방식을 모두 수행하게 된다(S130 및 S140).

지금까지 본 발명에 따른 구체적인 실시예에 관하여 설명하였으나, 본 발명의 범위에서 벗어나지 않는 한도 내에서는 여러 가지 변형이 가능함은 물론이다.

그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 안되며, 후술하는 특허 청구의 범위뿐 아니라 이 특허청구의 범위와 균등한 것들에 의해 정해져야 한다.

이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 이는 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명 사상은 아래에 기재된 특허 청구 범위에 의해서만 파악되어야 하고, 이의 균등 또는 등가적 변형 모두는 본 발명 사상의 범주에 속한다고 할 것이다.

이상에서 기술된 바와 같이 본 발명은 H.264 동영상 표준 부호화 방식이 사용되는 디지털 영상기기에서 고속 부호화가 가능토록 고안된 기법으로, 특히 저비트율 또는 고속처리가 요망되는 압축 부호화에 적용될 수 있다.

Claims

H.264에서의 동영상 부호화 방법에 있어서,

정수 변환된 최대 DCT 계수값(
)를 탐색하는 단계와;

상기 정수 변환된 최대 DCT 계수값(
)이 소정의 임계값 보다 작은 경우에는 DCT 및 양자화 과정을 생략하는 단계를 포함하는 것을 특징으로 하는 고속 동영상 압축을 위한 DCT 및 양자화 과정 생략 방법.
청구항 1에 있어서,

모든 DCT 계수값들이 '0'으로 양자화되는 충분조건은,

이며, 여기서
는 H.264의 정수 변환만을 거친 계수이고,
은 H.264에서의 실제 양자화 값이고, PF는 포스트 스케일링 요소이고, MF는 정수 보정을 위한 요소이며,
인 것을 특징으로 하는 고속 동영상 압축을 위한 DCT 및 양자화 과정 생략 방법.