KR101305093B1

KR101305093B1 - 변환 단위의 크기 결정 방법 및 그 부호화 장치

Info

Publication number: KR101305093B1
Application number: KR1020120056760A
Authority: KR
Inventors: 최기호; 장의선
Original assignee: 한양대학교 산학협력단
Priority date: 2012-05-29
Filing date: 2012-05-29
Publication date: 2013-09-12

Abstract

변환 단위의 크기 결정 방법 및 그 부호화 장치가 개시된다. 본 발명에 따른 부호화 장치는, 현재 심도에서의 변환 단위(TU)에 대한 DCT 변환을 수행하는 DCT 변환부; 상기 변환 단위에 대한 DCT 변환 결과 생성된 DCT 계수들 중 0이 아닌 넌제로 DCT 계수의 개수를 산출하는 넌제로 DCT 계수 산출부; 및 상기 산출된 넌제로 DCT 계수의 개수가 미리 지정된 임계값보다 적은 경우에는 하위 심도의 변환 단위에 대한 판단을 생략하고, 현재 심도의 변환 단위의 크기를 최적 변환 단위의 크기로 결정하는 결정부를 포함한다. 본 발명에 의해, 부호화 장치를 사용하는 모든 기기에서 동영상 부호화 시간을 단축할 수 있도록 하는 효과가 있다.

Description

변환 단위의 크기 결정 방법 및 그 부호화 장치{Method and encoder for determining transform unit size}

본 발명은 변환 단위(TU, Transform Unit)의 크기 결정 방법 및 그 부호화 장치에 관한 것이다.

다양한 멀티미디어 기기의 발전과 디지털 멀티미디어 방송 서비스의 일반화 등으로 인해 고화질 동영상 서비스에 대한 수요가 증가하고 있다. 이를 위해, 고해상도의 비디오 컨텐츠를 재생하고 저장할 수 있는 기기의 개발 및 보급이 가속화되고 있으며, 또한 고해상도의 비디오 컨텐츠를 효과적으로 부호화하거나 복호화하는 비디오 코덱의 개발이 진행되고 있다.

참고로, 종래 기술에 따른 비디오 코덱인 H.264/AVC는 하나의 화면을 16x16의 매크로블록(MB, Macroblock)을 통해 분할하여 부호화하지만, 차세대 동영상 부호화 기술인 HEVC(High Efficiency Video Coding)는 보다 효과적인 부호화가 가능하도록 하기 위해 도 1a 및 도 1b에 도시된 바와 같이 계층적 부호화 구조를 이용한다.

도 1a 및 도 1b에 도시된 바와 같이 기본 부호화 단위인 정사각형의 CU(coding unit)를 사용하여 부호화하며, 예측 기본 단위로는 PU(prediction unit)를 이용하며 여러 개의 블록으로 분할되어 예측에 사용된다. 예측 후에는 변환(transform) 및 양자화(quantization)를 위한 기본 단위인 TU(transform unit)를 이용하여 부호화를 수행한다. 이와 같이, 부호화 단위(Coding Unit, CU), 예측 단위(Prediction Unit, PU) 및 변환 단위(Transform Unit, TU)라는 세 개의 블록 개념을 가지는 계층적 부호화 구조는 일부 논문자료 “Improved Video Compression Efficiency Through Flexible Unit Representation and Corresponding Extension of Coding Tools”에서도 제시되고 있다(W.-J. Han, J. Min, I.-K. Kim, E. Alshina, A. Alshin, T. Lee, J. Chen, V. Seregin, S. Lee, Y. M. Hong, M.-S. Cheon, N. Shlyakhov, K. McCann, T. Davies, J.-H. Park, “Improved Video Compression Efficiency Through Flexible Unit Representation and Corresponding Extension of Coding Tools,” IEEE Trans. Circuits Syst. Video Technol., vol. 20, no. 12, pp. 17091720, Dec. 2010).

도 1a는 HEVC에서 제시하는 심도(depth)별 부호화 단위(CU) 및 예측 단위(PU)를 나타낸 도면이고, 도 1b는 HEVC의 계층 구조를 나타낸다.

여기서, 심도(depth)란 부호화 단위(CU)나 변환 단위(TU)가 계층적으로 분할되는 단계를 의미하고, 심도가 깊어질수록 최대 부호화 단위나 최대 변환 단위는 보다 작은 정사각형의 크기로 분할된다. 상위 심도(예를 들어, 심도 0)로부터 하위 심도(예를 들어, 심도 3)의 방향으로 심도가 깊어진다고 표현될 수 있으며, 심도가 깊어짐에 따라 최대 부호화 단위의 분할 횟수가 증가하고, 최대 부호화 단위의 분할 가능한 총 횟수는 최대 심도로 대응된다. 부호화 단위나 변환 단위의 최대 크기 및 최대 심도는 미리 설정되어 있을 수 있다.

도 1a에는 부호화 단위의 계층 구조로서 부호화 단위의 최대 높이 및 너비가 64이며, 최대 심도가 3인 경우가 도시되어 있다. 도시된 바와 같이, 최상위 심도(즉, 심도 0)에서의 최대 부호화 단위(110)의 크기는 64 x 64로 표현될 수 있다.

부호화 단위의 계층 구조의 세로축을 따라 심도가 깊어지며, 이에 따라 심도별 부호화 단위의 높이 및 너비가 각각 분할된다. 따라서, 최상위 심도인 심도 0에서의 최대 부호화 단위의 크기인 64 x 64는 심도 1에서 32 x 32인 부호화 단위의 크기로 분할(120)되고, 심도 2에서 16 x 16인 부호화 단위의 크기로 분할(130)되고, 최하위 심도인 심도 3에서 8 x 8인 부호화 단위의 크기로 분할(140)된다. 여기서, 심도 3의 8 x 8 크기의 부호화 단위는 최소 부호화 단위라 지칭될 수 있다.

또한, 부호화 단위의 계층 구조의 가로축을 따라, 각각의 심도별 부호화 단위의 예측 부호화의 기반이 되는 부분적 데이터 단위인 예측 단위(PU)가 도시되어 있다. 즉, 심도 0의 크기 64 x 64의 부호화 단위(110)의 예측 단위는, 크기 64 x 64의 부호화 단위에 포함되는 64 x 64 크기의 부분적 데이터 단위, 64x32 크기의 부분적 데이터 단위, 32 x 64 크기의 부분적 데이터 단위, 32x32 크기의 부분적 데이터 단위 등일 수 있다. 따라서, 부호화 단위는 각 부분적 데이터 단위들을 포함하는 최소 크기의 정사각형인 데이터 단위로 표현될 수도 있다.

마찬가지로, 심도 1의 32x32 크기의 부호화 단위의 예측 단위는 32x32 크기의 부분적 데이터 단위, 32x16 크기의 부분적 데이터 단위, 16x32 크기의 부분적 데이터 단위, 16x16 크기의 부분적 데이터 단위 등일 수 있고, 심도 2의 16x16 크기의 부호화 단위의 예측 단위는 16x16 크기의 부분적 데이터 단위, 16x8 크기의 부분적 데이터 단위, 8x16 크기의 부분적 데이터 단위, 8x8 크기의 부분적 데이터 단위 등일 수 있다.

도 1b에는 HEVC의 계층 구조가 도시되어 있다. 도 1b에 도시된 바와 같이, 결정된 하나의 부호화 단위(CU)에 대해 예측 단위(PU)를 여러 개의 블록으로 분할하여 인트라와 인터 모드 예측을 수행한 후, 변환 단위(TU)를 이용하여 변환 및 양자화를 수행한다. 변환 방법은 4×4 단위 크기에서 32×32 단위 크기 등의 정사각형 크기로 다양하다.

도 2a는 종래기술에 따른 HEVC의 변환 단위(TU) 크기 결정 과정을 나타낸 도면이고, 도 2b는 변환 단위의 크기가 결정된 예를 나타낸 도면이다.

차세대 동영상 부호화 기술인 HEVC(High Efficiency Video Coding)는 변환 단위의 크기를 32x32에서 4x4까지 사용하고 있다. 이를 통하여 HEVC에서는 최선의 부호화 이득(Best Coding gain)을 얻기 위해, 도 2a에 도시된 바와 같이 각각의 TU 심도(depth)에 해당하는 변환 단위의 크기를 모두 적용시켜 본 뒤 최적의 단위를 결정한다. 도 2b는 도 2a의 처리 과정을 모두 거친 뒤의 최적으로 결정된 TU 단위의 예시를 나타낸다.

즉, HEVC는 최적의 변환 단위 크기를 결정하기 위해 재귀적 구조(recursive structure)를 사용하고 있으며, 이를 수도 코드(pseudo code)로 표현하면 아래와 같다.

Recursive_TU_Processing (depth, index) {

parent_cost = TU_processing (depth, index)

for from index = 0 to index = 3 do

children_cost += Recursive_TU_Processing (depth+1, index)

end

if (parent_cost < children_cost)

Best_TU = TU(depth)

else

Best_TU = TU(depth+1)

if (leaf node)

return

}

위의 수도 코드에 표시된 바와 같이, HEVC 인코더는 현재 심도의 변환 단위 크기와 차하위 심도의 4개의 변환 단위 크기들에 대해 RD 비용(cost) 평가를 진행하며, 이러한 과정을 재귀적으로 동작하게 구성함으로써 하나의 최대 변환 단위 크기(Maximum TU size)에 대해 최적의 변환 단위들을 결정한다(도 2b 참조).

이와 같이, HEVC에서는 다양한 변환 단위의 크기를 사용하여 최적의 변환 단위 크기를 결정할 수는 있으나, 이 과정에서 복잡도의 증가가 야기되는 문제점이 있다.

따라서, 최적의 변환 단위의 크기를 신속하고 적은 복잡도로서 결정하기 위한 방안이 요구된다.

본 발명은 부호화기를 사용하는 모든 기기에서 비디오 데이터에 대한 부호화 시간을 단축할 수 있도록 하는 변환 단위의 크기 결정 방법 및 그 부호화 장치를 제공하기 위한 것이다.

본 발명은 부호화 처리를 위한 각 데이터 단위별 변환 단위의 크기를 신속하고 적은 복잡도로서 결정할 수 있도록 하는 변환 단위의 크기 결정 방법 및 그 부호화 장치를 제공하기 위한 것이다.

본 발명의 이외의 목적들은 하기의 설명을 통해 쉽게 이해될 수 있을 것이다.

본 발명의 일 측면에 따르면, 부호화 장치에 있어서, 현재 심도(depth)에서의 변환 단위(TU, Transform Unit)에 대한 DCT(Discrete Cosine Transform) 변환을 수행하는 DCT 변환부; 상기 변환 단위에 대한 DCT 변환 결과 생성된 DCT 계수들 중 0(zero)이 아닌 넌제로 DCT 계수의 개수를 산출하는 넌제로 DCT 계수 산출부; 및 상기 산출된 넌제로 DCT 계수의 개수가 미리 지정된 임계값(threshold)보다 적은 경우에는 하위 심도의 변환 단위에 대한 판단을 생략하고, 현재 심도의 변환 단위의 크기를 최적 변환 단위의 크기로 결정하는 결정부를 포함하는 부호화 장치가 제공된다.

상기 결정부는 현재 심도의 변환 단위의 크기에 대해 산출된 넌제로 DCT 계수의 개수가 상기 임계값 이상인 경우, 상기 DCT 변환부로 차하위 심도의 변환 단위에 대한 DCT 변환을 지시하고, 상기 넌제로 DCT 계수 산출부로 차하위 심도의 변환 단위에 대해 생성된 넌제로 DCT 계수의 개수를 산출하도록 지시할 수 있다.

상기 결정부는 최하위 심도까지 각각의 심도에서 산출된 넌제로 DCT 계수의 개수가 모두 상기 임계값 이상인 경우, 각각의 심도에서의 변환 단위들에 대한 비용 중 최소의 비용을 가지는 변환 단위의 크기를 최적 변환 단위의 크기로 결정할 수 있다.

상기 비용은 RD 비용(Rate-Distortion Cost) 평가를 위해 미리 지정된 비용 함수의 연산 결과값일 수 있다.

상기 임계값은 3일 수 있고, 현재 심도의 변환 단위의 폭 및 너비는 차하위 심도의 변환 단위의 폭 및 너비의 각각 2배일 수 있다.

전술한 것 외의 다른 측면, 특징, 이점이 이하의 도면, 특허청구범위 및 발명의 상세한 설명으로부터 명확해질 것이다.

본 발명의 실시예에 따르면, 부호화기를 사용하는 모든 기기에서 비디오 데이터에 대한 부호화 시간을 단축할 수 있도록 하는 효과가 있다.

또한, 부호화 처리를 위한 각 데이터 단위별 변환 단위의 크기를 신속하고 적은 복잡도로서 결정할 수 있도록 하는 효과도 있다.

도 1a는 HEVC에서 제시하는 심도(depth)별 부호화 단위(CU) 및 예측 단위(PU)를 나타낸 도면.
도 1b는 HEVC의 계층 구조를 나타낸 도면.
도 2a는 종래기술에 따른 HEVC의 변환 단위(TU) 크기 결정 과정을 나타낸 도면.
도 2b는 변환 단위의 크기가 결정된 예를 나타낸 도면.
도 3은 본 발명의 일 실시예에 따른 변환 단위(TU) 크기 결정 유닛의 구성을 나타낸 블록 구성도.
도 4는 본 발명의 일 실시예에 따른 데이터 단위별 변환 단위의 크기를 결정하기 위한 처리 과정을 나타낸 도면.
도 5는 본 발명의 일 실시예에 따른 변환 단위 결정 방법을 나타낸 순서도.

본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세하게 설명하고자 한다. 그러나 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변환, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.

제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.

본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

또한, 명세서에 기재된 "…부", "…기", "…유닛", "…모듈", "…블록" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.

이하, 본 발명의 실시예를 첨부한 도면들을 참조하여 상세히 설명하기로 하며, 첨부 도면을 참조하여 설명함에 있어, 동일하거나 대응하는 구성 요소는 동일한 도면번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다.

이하에서는 최적의 변환 단위 크기를 신속하게 결정할 수 있는 부호화기를 중심으로 설명하지만, 동일 또는 유사한 기술적 사상이 복호화기에 적용될 수도 있음은 당연하다.

또한, 변환 단위의 크기 결정 방법을 적용함에 있어 영상 특성을 고려하기 위해 계층적인 변환 단위가 사용되고, 변환 단위의 최대 높이 및 너비, 최대 심도는 영상의 특성에 따라 적응적으로 결정될 수도 있으며, 사용자의 요구에 따라서도 다양하게 설정되도록 구현될 수 있다.

도 3은 본 발명의 일 실시예에 따른 변환 단위(TU) 크기 결정 유닛의 구성을 나타낸 블록 구성도이고, 도 4는 본 발명의 일 실시예에 따른 데이터 단위별 변환 단위의 크기를 결정하기 위한 처리 과정을 나타낸 도면이다.

도 3을 참조하면, 변환 단위(TU, Transform Unit) 크기 결정 유닛(300)은 DCT 변환부(310), 넌제로 DCT 계수(Non-zero DCT coefficient) 산출부(320), 탐색 여부 결정부(330) 및 변환 단위(TU) 크기 결정부(340)를 포함할 수 있다.

DCT 변환부(310)는 현재 깊이(depth)의 변환 단위 크기에서 입력된 값들에 대한 DCT 변환을 수행하여 DCT 계수들을 생성한다.

넌제로 DCT 계수 산출부(320)는 DCT 변환부(310)의 DCT 변환에 의해 생성된 DCT 계수들 중 0이 아닌 DCT 계수인 넌제로(Non-zero) DCT 계수의 수량을 산출한다.

탐색 여부 결정부(330)는 넌제로 DCT 계수 산출부(320)에 의해 산출된 넌제로 DCT 계수의 개수가 미리 지정된 임계값보다 작은지 여부를 판단하고, 임계값 이상인 경우(즉, 임계값과 같거나 초과하는 경우)에만 차하위 심도의 변환 단위 크기에 대한 탐색을 진행하도록 결정한다.

탐색 여부 결정부(330)에 의해 차하위 심도의 변환 단위 크기에 대한 탐색이 진행되도록 결정되면, DCT 변환부(310)와 넌제로 DCT 계수 산출부(320)는 차하위 심도의 변환 단위 크기에 대해 각각 지정된 처리를 수행할 것이다.

여기서, 임계값은 현재 깊이의 변환 단위 크기에서 DCT 변환 이후 나타나는 0이 아닌 DCT 계수의 개수와 비교하기 위해 지정되며, 그 값은 변환 단위의 크기가 NxN인 경우를 가정할 때 최소 0부터 최대 N² 중 어느 하나일 수 있다. 임계값은 시간 복잡도 감소율과 비트레이트 증가율을 고려하여 실험적 통계적으로 선택하여 결정될 수 있으며, 본 발명자의 실험에서는 임계값을 3으로 지정하였을 때 시간 복잡도 감소율 및 비트레이트 증가율 측면에서 최적의 효율이 나타났다.

변환 단위(TU) 크기 결정부(340)는 넌제로 DCT 계수 산출부(320)에 의해 산출된 넌제로 DCT 계수의 개수가 미리 지정된 임계값보다 작은지 여부를 판단하고, 임계값 미만인 경우에는 현재 심도의 변환 단위 크기가 최적의 변환 단위 크기인 것으로 결정한다. 즉, 산출된 넌제로 DCT 계수의 개수가 미리 지정된 임계값보다 작다면, 탐색 여부 결정부(330)는 차하위 심도의 변환 단위 크기에 대한 탐색을 생략하고, 변환 단위 크기 결정부(340)는 현재 심도의 변환 단위 크기를 최적의 변환 단위 크기인 것으로 결정한다.

전술한 바와 같이 본 실시예에 따른 변환 단위(TU) 크기 결정 유닛(300)은, 현재 깊이(depth)의 변환 단위 크기에서의 DCT(Discrete Cosine Transform) 변환(transform) 이후 나타나는 DCT 계수들 중 0이 아닌 DCT 계수인 넌제로 DCT 계수들의 개수가 미리 지정된 임계값(threshold) 미만인지 여부로서, 최적의 변환 단위 크기 결정을 위한 차하위 심도의 탐색을 진행할 것인지 여부 및 최적의 변환 단위 크크기를 조기에 결정하는 특징을 가지고 있다.

즉 도 4에 예시된 바와 같이, 심도 i에서는 DCT 변환 결과 산출된 넌제로 DCT 계수의 개수(NZD)가 4개로서 미리 지정된 임계값보다 크기 때문에 차하위 심도 i+1에 대한 탐색을 계속 진행하지만, 심도 i+1에 해당하는 복수의 변환 단위 크기들 중 어느 하나인 TU_i ₊₁3은 DCT 변환 이후 산출된 넌제로 DCT 계수의 개수가 2개로서 미리 지정된 임계값보다 작기 때문에 해당 변환 단위의 크기에 대해 남은 차하위 심도 i+2에 해당하는 복수의 변환 단위 크기들에 대한 탐색을 생략하고 현재 심도 i+1에 해당하는 해당 변환 단위 크기를 최적의 변환 단위 크기로 결정한다.

이와 같이 최적의 변환 단위 크기를 결정하는 기술적 사상을 수도 코드(pseudo code)로 표현하면 아래와 같다.

Recursive_TU_Processing (depth, index) {

parent_cost = TU_processing (depth, index)

if ( Non-zero <= Threshold)

Best_TU = TU(depth)

pruning remaining processes

else

for from index = 0 to index = 3 do

children_cost += Recursive_TU_Processing (depth+1, index)

end

if (parent_cost < children_cost)

Best_TU = TU(depth)

else

Best_TU = TU(depth+1)

if (leaf node)

return

}

본 실시예에 따른 최적의 변환 단위 결정 기법이 적용된 실험 환경 및 실험 결과가 하기 표 1 및 표 2에 각각 표시되어 있다.

참고로, 표 1은 실험 환경을 나타내고, 표 2는 실험 결과를 나타낸다. 표 2와 같이 MPEG-H HEVC test model 3.0과 비교하여 변환 단위(TU) 결정 처리 시간(processing time)이 약 40% 감소(reduction)되었으며, 이에 비하여 비트레이트(bitrate) 0.5% 감소율, PSNR 감소율 0.05dB를 나타내었다.

Test Sequences	· Class A (2560' 600): Traffic and PeopleOnStreet · Class B (1920' 080): Kimono , ParkScene , Cactus , and BQTerrace · Class E (1280' 20): Vidyo1 , Vidyo3 , and Vidyo4
Total Frames to be Coded	·Class A: 5-second video duration ·Other Classes: 10-second video duration
Software	·HM 3.0
Quantization Parameter	·22, 27, 32 and 37
Others	·High efficiency setting and random-access scenario [6]

Seq .	HM 3.0			Proposed Method			Comparison
Seq .	Bitrate	PSNR	Time	Bitrate	PSNR	Time	Δ Bitrate (%)	ΔPSNR( dB )	Δ Time (%)
Traffic	10,587	36.74	697.29	10,553	36.72	450.76	-0.34	-0.02	-37.54
PeopleOnStreet	3,803	35.04	141.45	3,794	35.02	104.81	-0.33	-0.02	-28.74
Kimono	1,031	34.55	34.58	1,027	34.52	25.86	-0.44	-0.03	-28.29
ParkScene	1,862	40.19	246.60	1,847	40.16	104.67	-0.78	-0.03	-58.21
Cactus	14,423	37.11	1,116.54	14,363	37.05	690.30	-0.61	-0.06	-40.66
BQTerrace	9,620	36.74	548.42	9,564	36.70	300.70	-0.55	-0.04	-47.05
Vidyo1	3,533	35.09	112.66	3,523	35.04	74.15	-0.51	-0.05	-37.01
Vidyo3	942	34.78	27.46	940	34.74	18.51	-0.44	-0.04	-35.79
Vidyo4	10,587	36.74	697.29	10,553	36.72	450.76	-0.34	-0.02	-37.54
*Average*							-0.52	-0.05	-40.57

도 5는 본 발명의 일 실시예에 따른 변환 단위 결정 방법을 나타낸 순서도이다.

도 5를 참조하면, 변환 단위 크기 결정 유닛(300)의 DCT 변환부(310)는 단계 510에서 현재 심도의 변환 단위의 크기에 대해 입력된 입력 정보를 DCT 변환 처리하여 DCT 계수를 생성한다.

단계 520에서 넌제로 DCT 계수 산출부(320)는 DCT 변환부(310)에 의해 변환된 DCT 계수 중 0이 아닌 DCT 계수(즉, 넌제로 DCT 계수)의 개수를 산출한다.

단계 530에서 결정부는 산출된 넌제로 DCT 계수의 개수가 미리 지정된 임계값보다 적은지 여부를 판단한다.

만일 산출된 넌제로 DCT 계수의 개수가 미리 지정된 임계값보다 적다면, 결정부는 단계 540으로 진행하여 남은 차하위 심도의 변환 단위의 크기들에 대한 탐색을 생략하고 현재 심도의 변환 단위의 크기를 최적 변환 단위의 크기로 결정한다.

그러나 만일 산출된 넌제로 DCT 계수의 개수가 미리 지정된 임계값 이상이라면, 결정부는 단계 550으로 진행하여 모든 심도의 변환 단위의 크기들에 대한 탐색이 완료되었는지 여부를 판단한다.

만일 최소 변환 단위의 크기까지 탐색이 완료되지 않았다면 차하위 심도에 대한 탐색을 진행하기 위해 단계 510으로 다시 진행한다.

그러나 만일 최소 변환 단위의 크기까지 탐색이 완료되었다면 종래의 HEVC에서 적용되는 최적 변환 단위 크기 결정 방법인 RD 비용값을 고려한 최적 변환 단위 크기 결정 방법을 이용하여 최적 변환 단위의 크기를 결정한다.

상술한 변환 단위의 크기 결정 방법은 부호화기에 내장된 소프트웨어 프로그램 등에 의해 시계열적 순서에 따른 자동화된 절차로 수행될 수도 있음은 자명하다. 상기 프로그램을 구성하는 코드들 및 코드 세그먼트들은 당해 분야의 컴퓨터 프로그래머에 의하여 용이하게 추론될 수 있다. 또한, 상기 프로그램은 컴퓨터가 읽을 수 있는 정보저장매체(computer readable media)에 저장되고, 컴퓨터에 의하여 읽혀지고 실행됨으로써 상기 방법을 구현한다. 상기 정보저장매체는 자기 기록매체, 광 기록매체 및 캐리어 웨이브 매체를 포함한다.

상기에서는 본 발명의 실시예를 참조하여 설명하였지만, 해당 기술분야에서 통상의 지식을 가진 자라면 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.

300 : 변환 단위(TU, Transform Unit) 크기 결정 유닛
310 : DCT 변환부
320 : 넌제로 DCT 계수(Non-zero DCT coefficient) 산출부
330 : 탐색 여부 결정부
340 : 변환 단위(TU) 크기 결정부

Claims

부호화 장치에 있어서,
현재 심도(depth)에서의 변환 단위(TU, Transform Unit)에 대한 DCT(Discrete Cosine Transform) 변환을 수행하는 DCT 변환부;
상기 변환 단위에 대한 DCT 변환 결과 생성된 DCT 계수들 중 넌제로(Non-zero) DCT 계수의 개수를 산출하는 넌제로 DCT 계수 산출부; 및
상기 산출된 넌제로 DCT 계수의 개수가 미리 지정된 임계값(threshold)보다 적은 경우에는 하위 심도의 변환 단위에 대한 판단을 생략하고, 현재 심도의 변환 단위의 크기를 최적 변환 단위의 크기로 결정하는 결정부를 포함하는 부호화 장치.
제1항에 있어서,
상기 결정부는 현재 심도의 변환 단위의 크기에 대해 산출된 넌제로 DCT 계수의 개수가 상기 임계값 이상인 경우, 상기 DCT 변환부로 차하위 심도의 변환 단위에 대한 DCT 변환을 지시하고, 상기 넌제로 DCT 계수 산출부로 차하위 심도의 변환 단위에 대해 생성된 넌제로 DCT 계수의 개수를 산출하도록 지시하는 것을 특징으로 하는 부호화 장치.
제2항에 있어서,
상기 결정부는 최하위 심도까지 각각의 심도에서 산출된 넌제로 DCT 계수의 개수가 모두 상기 임계값 이상인 경우, 각각의 심도에서의 변환 단위들에 대한 비용 중 최소의 비용을 가지는 변환 단위의 크기를 최적 변환 단위의 크기로 결정하는 것을 특징으로 하는 부호화 장치.
제3항에 있어서,
상기 비용은 RD 비용(Rate-Distortion Cost) 평가를 위해 산출된 RD 비용값인 것을 특징으로 하는 부호화 장치.
제1항에 있어서,
상기 임계값은 3인 것을 특징으로 하는 부호화 장치.
제2항에 있어서,
현재 심도의 변환 단위의 폭 및 너비는 차하위 심도의 변환 단위의 폭 및 너비의 각각 2배인 것을 특징으로 하는 부호화 장치.