WO2009093879A2

WO2009093879A2 - 시공간적 복잡도를 이용한 부호화 모드 결정 방법 및 장치

Info

Publication number: WO2009093879A2
Application number: PCT/KR2009/000400
Authority: WO
Inventors: Inseong Hwang; Hoojong Kim
Original assignee: Sk Telecom Co., Ltd.
Priority date: 2008-01-24
Filing date: 2009-01-28
Publication date: 2009-07-30
Also published as: JP5054826B2; KR100952340B1; EP2242276B1; EP2242276A2; EP2242276A4; JP2011510591A; KR20090081672A; WO2009093879A3; CN101926178B; US20110051801A1; CN101926178A; US8611416B2

Abstract

본 발명은 시공간적 복잡도를 이용한 부호화 모드 결정 방법 및 장치에 관한 것이다. 본 발명은 부호화 모드를 결정하는 장치에 있어서, 매크로 블록의 시간적 복잡도를 계산하는 시간적 복잡도 계산부; 및 시간적 복잡도를 이용하여 부호화 모드를 결정하는 모드 결정부를 포함하는 것을 특징으로 하는 시간적 복잡도를 이용한 부호화 모드 결정 장치를 제공한다. 본 발명에 의하면, 매크로 블록에 대한 시간적 복잡도와 공간적 복잡도를 더욱 정확하게 계산할 수 있을 뿐만 아니라 그를 이용하여 최적의 부호화 모드를 선별함으로써 율-왜곡 최적화 기법을 적용할 때의 계산의 복잡도를 줄이고 처리 속도를 향상할 수 있다.

Description

[규칙 제26조에 의한 보정]　시공간적 복잡도를 이용한 부호화 모드 결정 방법 및 장치

본 발명은 시공간적 복잡도를 이용한 부호화 모드 결정 방법 및 장치에 관한 것이다. 더욱 상세하게는, 율-왜곡 최적화(RDO: Rate-Distortion Optimization) 기법을 이용하여 매크로 블록(Macro Block)에 대해서 최적의 부호화 모드를 결정하는 데 있어서, 율-왜곡값(RD Cost: Rate-Distortion Cost)의 계산을 최소로 하기 위한 부호화 모드를 결정하는 방법 및 장치에 관한 것이다.

통상적으로, MPEG-1, MPEG-2, MPEG-4 Visual, H.261, H.263 및 H.264/MPEG-4 AVC 등의 영상 압축 표준안에서는 하나의 프레임을 복수 개의 매크로블록들로 분할한 후, 매크로블록 단위로 예측을 수행하여 예측 블록을 구하고, 원래의 영상 블록과 예측 블록의 차이를 변환 및 양자화하는 방식으로 영상 데이터를 압축한다.

예측의 방식으로는 인트라 예측(Intra Prediction)과 인터 예측(Inter Prediction)의 두 가지 종류가 있다. 인트라 예측은 현재 프레임에 존재하는 주변 블록의 데이터를 이용하여 현재 블록의 예측을 수행한다. 인터 예측은 블록 기반 움직임 보상을 이용하여 이전에 부호화된 하나 또는 그 이상의 비디오 프레임으로부터 현재 블록에 대응되는 예측 블록을 생성한다.

특히, 인터 예측시에 H.264/MPEG-4 AVC는 고정된 크기의 블록이 아니라 4×4로부터 16×16까지의 7 종류의 가변 블록 모드를 이용하여 움직임 예측을 수행한다.

도 1a는 종래 H.264/MPEG-4 AVC의 가변 블록 크기 움직임 예측에서 이용되는 다양한 크기의 블록들을 나타낸 예시도이다.

도 1a에 도시된 바와 같이, 각 매크로블록의 휘도 성분(16×16 샘플)은 4가지 방법으로 분할될 수 있다. 즉, 각 매크로 블록은 하나의 16×16 매크로블록 파티션, 두 개의 16×8 파티션, 두 개의 8×16 파티션 또는 네 개의 8×8 파티션으로 분할되어 움직임 예측될 수 있다.

또한, 8×8 모드가 선택되면 매크로블록 내의 네 개의 8×8 서브 매크로블록은 각각 4가지 방법으로 다시 분할될 수 있다. 즉, 8×8 모드가 선택된 경우, 각 8×8 블록은 하나의 8×8 서브 매크로블록 파티션, 두 개의 8×4 서브 매크로블록 파티션, 두 개의 4×8 서브 매크로블록 파티션 또는 네 개의 4×4 서브 매크로블록 파티션 중 하나로 분할된다.

각 매크로블록 내에서 이러한 파티션과 서브 매크로블록의 매우 많은 수의 조합이 가능하다. 매크로블록을 다양한 크기의 서브 블록으로 나누는 이러한 방법을 트리구조 움직임 보상(Tree Structured Motion Compensation)이라고 한다.

하나의 매크로블록에 대해서 최적의 부호화 모드를 결정하기 위해서, H.264 표준안에 따르면 율-왜곡 최적화 기법을 이용한다. 통상적인 율-왜곡 최적화 등식은 다음의 수학식 1과 같다.

수학식 1

수학식 1에서 J_mode는 율-왜곡값, λ_mode는 라그랑지 승산자(Lagrangian Multiplier), D는 원 매크로블록과 재구성된 매크로블록 사이의 왜곡값, R은 모드 선택 및 매크로블록의 양자화값 등과 관련된 비트수를 반영하는 계수이다. 수학식 1을 이용하여 각 매크로블록을 다양한 가변블록으로 나누어 부호화해 본 다음에 최소의 율-왜곡값을 갖는 모드를 최적의 모드로 결정한다.

즉, 부호화기는 모든 예측된 부호화 모드에 대해 부호화 과정을 수행한 후 율-왜곡값을 계산하여 율-왜곡값이 가장 작은 예측 모드를 실제 부호화에 이용할 예측 모드로서 결정한다.

이러한 율-왜곡 최적화 기법은 H.264/AVC 부호화기의 압축 성능을 획기적으로 향상시키지만, 그로 인해 복잡도가 매우 많이 증가하기 때문에 실시간 부호화에 큰 장애가 되는 문제점이 있다.

도 1b는 율-왜곡 최적화의 수행에 따른 계산 복잡도를 나타낸 예시도이다.

도 1b에 도시한 바와 같이, 율-왜곡 최적화를 수행하는 경우가 그렇지 않은 경우에 비해 최소 7배 내지 8배 이상으로 계산의 복잡도가 증가한다.

따라서, 율-왜곡 최적화 기법을 이용하여 부호화하여 압축에 대한 성능을 유지하면서도 부호화기가 영상을 압축하는 데 소요되는 속도를 최소화하고 계산의 복잡도를 획기적으로 감소시키기 위한 기술의 개발이 필요한 실정이다.

전술한 요구에 부응하기 위해 본 발명은, 율-왜곡 최적화 기법을 이용하여 매크로 블록에 대해서 최적의 부호화 모드를 결정하는 데 있어서, 율-왜곡값의 계산을 최소로 하기 위한 부호화 모드를 결정하는 방법 및 장치를 제공하는 데 그 목적이 있다.

전술한 목적을 달성하기 위해 본 발명은, 부호화 모드를 결정하는 장치에 있어서, 매크로 블록의 시간적 복잡도를 계산하는 시간적 복잡도 계산부; 및 시간적 복잡도를 이용하여 부호화 모드를 결정하는 모드 결정부를 포함하는 것을 특징으로 하는 시간적 복잡도를 이용한 부호화 모드 결정 장치를 제공한다.

또한, 본 발명의 다른 목적에 의하면, 부호화 모드를 결정하는 장치에 있어서, 매크로 블록의 공간적 복잡도를 계산하는 공간적 복잡도 계산부; 및 공간적 복잡도를 이용하여 부호화 모드를 결정하는 모드 결정부를 포함하는 것을 특징으로 하는 공간적 복잡도를 이용한 부호화 모드 결정 장치를 제공한다.

또한, 본 발명의 또 다른 목적에 의하면, 부호화 모드를 결정하는 장치가 부호화 모드를 결정하는 방법에 있어서, (a) 매크로 블록의 시간적 복잡도를 계산하는 단계; (b) 매크로 블록의 공간적 복잡도를 계산하는 단계; (c) 시간적 복잡도가 기 설정된 시간 임계치보다 큰 경우에는 인트라 블록 모드를 부호화 모드로서 결정하는 단계; 및 (d) 시간적 복잡도가 시간 임계치보다 작거나 같은 경우에는 인터 블록 모드를 부호화 모드로서 결정하는 단계를 포함하는 것을 특징으로 하는 시공간적 복잡도를 이용한 부호화 모드 결정 방법을 제공한다.

이상에서 설명한 바와 같이 본 발명에 의하면, 매크로 블록에 대한 시간적 복잡도와 공간적 복잡도를 더욱 정확하게 계산할 수 있을 뿐만 아니라 그를 이용하여 최적의 부호화 모드를 선별함으로써 율-왜곡 최적화 기법을 적용할 때의 계산의 복잡도를 줄이고 처리 속도를 향상할 수 있다.

도 1a는 종래 H.264/MPEG-4 AVC의 가변 블록 크기 움직임 예측에서 이용되는 다양한 크기의 블록들을 나타낸 예시도,

도 1b는 율-왜곡 최적화의 수행에 따른 계산 복잡도를 나타낸 예시도,

도 2는 본 발명의 일 실시예에 따른 시공간적 복잡도를 이용한 부호화 모드 결정 장치의 전자적인 구성을 나타낸 블록 구성도,

도 3은 도 3은 본 발명의 일 실시예에 따른 시공간적 복잡도를 이용한 부호화 모드 결정 방법을 설명하기 위한 순서도,

도 4는 본 발명의 일 실시예에 따라 시간적 복잡도와 공간적 복잡도를 계산하는 과정을 설명하기 위한 예시도이다.

이하, 본 발명의 바람직한 실시예를 첨부된 도면들을 참조하여 상세히 설명한다. 우선 각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.

H.264의 영상 압축 표준에 따르면, 매크로 블록이 가질 수 있는 블록 모드의 종류는 표 1 및 표 2에 나타낸 바와 같다.

표 1은 인트라 블록 모드의 종류와 분류를 나타낸 것이고, 표 2는 인터 블록 모드의 종류와 분류를 나타낸 것이다.

표 1

표 2

본 발명에서는 크기에 따라, 4 개의 인트라 블록 모드(인트라 16X16_Vertical, 인트라 16X16_Horizontal, 인트라 16X16_DC, 인트라 16X16_Plane)와 4 개의 인터 블록 모드(인터 SKIP, 인터 16X16, 인터 16X8, 인터 8X16)를 '대형 블록 모드'라 정의하고, 9 개의 인트라 블록 모드(인트라 4X4_Vertical, 인트라 4X4_Horizontal, 인트라 4X4_DC, 인트라 4X4_Diagonal Down Left, 인트라 4X4_Diagonal Down Right, 인트라 4X4_Vertical Right, 인트라 4X4_Horizontal Down, 인트라 4X4_Vertical Left, 인트라 4X4_Horizontal UP)와 4 개의 인터 블록 모드(인터 8X8, 인터 8X4, 인터 4X8, 인터 4X4)를 '소형 블록 모드'라 정의한다.

또한, 본 발명에서는 방향성에 따라, 수직 방향성을 갖는 4 개의 인트라 블록 모드(인트라 16X16_Vertical, 인트라 4X4_Vertical, 인트라 4X4_Vertical Right, 인트라 4X4_Vertical Left)와 수직 방향성을 갖는 2 개의 인터 블록 모드(인터 8X16, 인터 4X8)를 '수직 방향성 블록 모드'라 정의하고, 수평 방향성을 갖는 4 개의 인트라 블록 모드(인트라 16X16_Horizontal, 인트라 4X4_Horizontal, 인트라 4X4_Horizontal Down, 인트라 4X4_Horizontal UP)와 2 개의 인터 블록 모드(인터 16X8, 인터 8X4)를 '수평 방향성 블록 모드'라 정의하며, 수직 또는 수평의 방향성을 갖지 않는 5 개의 인트라 블록 모드(인트라 16X16_DC, 인트라 16X16_Plane, 인트라 4X4_DC, 인트라 4X4_Diagonal Down Left, 인트라 4X4_Diagonal Down Right)와 4 개의 인터 블록 모드(인터 SKIP, 인터 16X16, 인터 8X8, 인터 4X4)를 '비 방향성 블록 모드'라 정의한다.

따라서, 표 1 및 표 2에 나타낸 인트라 블록 모드 또는 인터 블록 모드는 각각 그 크기와 방향성에 따라 '분류' 항목에 나타낸 바와 같이 분류될 수 있다. 즉, 예를 들어 '인트라 16X16_Vertical'은 '인트라 블록 모드'로서 16X16의 크기를 갖으므로 '대형 블록 모드'이고 Vertical의 특성이 있으므로 '수직 방향성 블록 모드'이다. 따라서 이러한 특성들을 조합하면 표 1에 나타낸 분류와 같이 '대형 수직 방향성 인트라 블록 모드'로 분류할 수 있다. 나머지 인트라 블록 모드 및 인터 블록 모드도 이러한 방식으로 분류할 수 있다.

도 2는 본 발명의 일 실시예에 따른 시공간적 복잡도를 이용한 부호화 모드 결정 장치의 전자적인 구성을 나타낸 블록 구성도이다.

본 발명의 일 실시예에 따른 부호화 모드 결정 장치는 시간적 복잡도(Temporal Complexity) 계산부(210), 공간적 복잡도(Spatial Complexity) 계산부(220) 및 모드 결정부(220)를 포함하여 구성한다.

본 발명의 일 실시예에 따른 시간적 복잡도 계산부(210)는 연산을 수행하여 데이터를 생성하고 저장하는 데이터 처리 수단으로서, 영상의 매크로 블록(Macro Block)을 분석하여 매크로 블록의 시간적 복잡도를 계산한다.

또한, 본 발명의 일 실시예에 따른 시간적 복잡도 계산부(210)는 매크로 블록의 레지듀얼(Residual)인 블록 레지듀얼(Block Residual)을 계산하고 블록 레지듀얼을 아다마드 변환(Hadamard Transform)하여 시간적 블록 복잡도(Temporal Block Complexity)를 계산한 후 시간적 블록 복잡도를 양자화 폭(Quantization Step Size)으로 나누어 시간적 복잡도를 계산한다. 시간적 복잡도를 계산하는 과정에 대해서는 도 4를 통해 상세히 설명한다.

본 발명의 일 실시예에 따른 공간적 복잡도 계산부(220)는 연산을 수행하여 데이터를 생성하고 저장하는 데이터 처리 수단으로서, 영상의 매크로 블록을 분석하여 매크로 블록의 공간적 복잡도를 계산한다.

또한, 본 발명의 일 실시예에 따른 공간적 복잡도 계산부(220)는 매크로 블록을 수직 필터링(Vertical Filtering)하여 수직 복잡도(Vertical Complexity)를 계산하고, 매크로 블록을 수평 필터링(Horizontal Filtering)하여 수평 복잡도(Horizontal Complexity)를 계산하며, 수직 복잡도와 수평 복잡도를 합하여 공간적 블록 복잡도(Spatial Block Complexity)를 계산한 후 양자화 폭으로 나누어 공간적 복잡도를 계산한다. 공간적 복잡도를 계산하는 과정에 대해서는 도 4를 통해 상세히 설명한다.

본 발명의 일 실시예에 따른 모드 결정부(230)는 연산을 수행하여 데이터를 생성하고 저장하는 데이터 처리 수단으로서, 시간적 복잡도 계산부(210)에서 계산한 시간적 복잡도와 공간적 복잡도 계산부(220)에서 계산한 공간적 복잡도를 이용하여 부호화할 블록 모드인 부호화 모드(Encoding Mode)를 결정한다.

즉, 본 발명의 일 실시예에 따른 모드 결정부(230)는 시간적 복잡도가 크면 인트라 모드로 부호화할 확률이 높으므로 인트라 블록 모드(인트라 16X16_Vertical, 인트라 16X16_Horizontal, 인트라 16X16_DC, 인트라 16X16_Plane, 인트라 4X4_Vertical, 인트라 4X4_Horizontal, 인트라 4X4_DC, 인트라 4X4_Diagonal Down Left, 인트라 4X4_Diagonal Down Right, 인트라 4X4_Vertical Right, 인트라 4X4_Horizontal Down, 인트라 4X4_Vertical Left, 인트라 4X4_Horizontal UP)를 부호화 모드로서 결정하고, 시간적 복잡도가 작으면 인터 모드로 부호화할 확률이 높으므로 인터 블록 모드(인터 SKIP, 인터 16X16, 인터 16X8, 인터 8X16, 인터 8X8, 인터 8X4, 인터 4X8, 인터 4X4)를 부호화 모드로서 결정한다.

따라서, 본 발명의 일 실시예에 따른 모드 결정부(230)는 시간적 복잡도를 기 설정된 시간 임계치와 비교하여 시간적 복잡도가 시간 임계치보다 큰 경우에는 인트라 블록 모드를 부호화 모드로서 결정하고, 시간적 복잡도가 시간 임계치보다 작거나 같은 경우에는 인터 블록 모드를 부호화 모드로서 결정한다.

본 발명에서 시간 임계치란 현재의 매크로 블록을 포함하는 현재 프레임의 이전의 프레임인 이전 프레임에서 현재의 매크로 블록과 동일한 위치를 갖는 이전 매크로 블록의 시간적 복잡도를 말한다.

또한, 본 발명의 일 실시예에 따른 모드 결정부(230)는 공간적 복잡도가 크면 작은 크기 즉 소형의 블록 모드가 부호화 모드로 결정될 확률이 높으므로 소형 블록 모드(인트라 4X4_Vertical, 인트라 4X4_Horizontal, 인트라 4X4_DC, 인트라 4X4_Diagonal Down Left, 인트라 4X4_Diagonal Down Right, 인트라 4X4_Vertical Right, 인트라 4X4_Horizontal Down, 인트라 4X4_Vertical Left, 인트라 4X4_Horizontal UP, 인터 8X8, 인터 8X4, 인터 4X8, 인터 4X4)를 부호화 모드로서 결정하고, 공간적 복잡도가 작으면 큰 크기 즉 대형의 블록 모드가 부호화 모드로 결정될 확률이 높으므로 대형 블록 모드(인트라 16X16_Vertical, 인트라 16X16_Horizontal, 인트라 16X16_DC, 인트라 16X16_Plane, 인터 SKIP, 인터 16X16, 인터 16X8, 인터 8X16)를 부호화 모드로서 결정한다.

따라서, 본 발명의 일 실시예에 따른 모드 결정부(230)는 공간적 복잡도와 기 설정된 공간 임계치를 비교하여 공간적 복잡도가 공간 임계치보다 크면 소형 블록 모드를 부호화 모드로서 결정하고, 공간적 복잡도가 공간 임계치보다 작거나 같으면 대형 블록 모드를 부호화 모드로서 결정한다.

본 발명에서 공간 임계치란 현재의 매크로 블록을 포함하는 현재 프레임의 이전의 프레임인 이전 프레임에서 현재의 매크로 블록과 동일한 위치를 갖는 이전 매크로 블록의 공간적 복잡도를 말한다.

또한, 본 발명의 일 실시예에 따른 모드 결정부(230)는 매크로 블록의 수직 복잡도와 매크로 블록의 수평 복잡도를 비교하여 수직 복잡도가 수평 복잡보다 크면 수직 방향성을 갖는 블록 모드인 수직 방향성 블록 모드(인트라 16X16_Vertical, 인트라 4X4_Vertical, 인트라 4X4_Vertical Right, 인트라 4X4_Vertical Left, 인터 8X16, 인터 4X8)를 부호화 모드로서 결정하고, 수직 복잡도와 수평 복잡도가 동일한 경우에는 방향성을 갖지 않는 블록 모드인 비 방향성 블록 모드(인트라 16X16_DC, 인트라 16X16_Plane, 인트라 4X4_DC, 인트라 4X4_Diagonal Down Left, 인트라 4X4_Diagonal Down Right, 인터 SKIP, 인터 16X16, 인터 8X8, 인터 4X4)를 부호화 모드로서 결정하며, 수직 복잡도가 수평 복잡도보다 작은 경우에는 수평 방향성 블록 모드(인트라 16X16_Horizontal, 인트라 4X4_Horizontal, 인트라 4X4_Horizontal Down, 인트라 4X4_Horizontal UP, 인터 16X8, 인터 8X4)를 부호화 모드로 결정한다.

본 발명에서 시간적 복잡도 계산부(210), 공간적 복잡도 계산부(220) 및 모드 계산부(230)는 각 기능을 수행하는 프로그램과 데이터를 저장하는 메모리 및 메모리에 저장된 프로그램을 실행하고 데이터를 생성하여 메모리에 저장하는 마이크로프로세서를 포함하는 독립적인 하드웨어로서 구현될 수도 있지만, 각 기능을 수행하는 프로그램 모듈로서 구현되어 메모리에 저장되고 마이크로프로세서에 의해 실행될 수도 있을 것이다.

또한, 이상에서는 모드 계산부(230)가 시간적 복잡도를 이용하여 인트라 블록 모드 또는 인터 블록 모드를 부호화 모드로서 결정하고 공간적 복잡도를 이용하여 소형 블록 모드 또는 대형 블록 모드를 부호화 모드로서 결정하며 수직 복잡도와 수평 복잡도를 이용하여 수직 방향성 블록 모드, 비 방향성 블록 모드 및 수평 방향성 블록 모드 중 어느 하나를 부호화 모드로서 결정하는 것이 각각 선택적으로 수행되는 것으로 설명했지만, 각각 서로 종합하여 수행할 수도 있을 것이다.

즉, 예를 들어 시간적 복잡도가 시간 임계치보다 크고 공간적 복잡도가 공간 임계치보다 크며 수직 복잡도가 수평 복잡도보다 큰 경우, 모드 계산부(230)는 인트라 블록 모드 중에서 소형이면서 수직 방향성을 갖는 블록 모드인 소형 수직 방향성 인트라 블록 모드(인트라 4X4_Vertical, 인트라 4X4_Vertical Right, 인트라 4X4_Vertical Left)를 부호화 모드로서 결정한다. 따라서, 이 경우 본 발명의 일 실시예에 따른 시공간적 복잡도를 이용한 부호화 모드 결정 장치를 포함하는 부호화기는 부호화 모드 결정 장치가 부호화 모드로 결정한 전술한 3 개의 블록 모드만의 율-왜곡값을 계산하여 최종 부호화 모드를 결정할 수 있어, 율-왜곡 최적화 기법을 수행하기 위한 계산량이나 처리 시간을 최소화할 수 있다.

영상 또는 동영상을 압축하는 부호화기는 동영상을 부호화하기 전에 동영상을 프레임 단위로 분할하고, 각 프레임의 이미지를 매크로 블록으로 분할하여 부호화하는데, 이때 부호화 모드를 결정한다. 부호화기가 부호화 모드를 결정할 때 H.264 영상 압축 표준에서는 율-왜곡 최적화 기법을 이용한다. 하지만, 율-왜곡 최적화 기법을 이용하여 부호화 모드를 결정할 때, 부호화 모드로 예상되는 모든 블록 모드(즉, 인트라 블록 모드들과 인터 블록 모드들)에 대해 율-왜곡 최적화 기법을 수행하여 율-왜곡값을 구하므로 계산이 매우 복잡해 지고 계산에 따른 부호화기의 부하 부담이 증가하며 그로 인해 부호화에 많은 시간이 소요된다.

따라서, 본 발명에서는 전술한 바와 같이, 부호화기가 율-왜곡값을 계산해야 하는 블록 모드의 개수를 최소화할 수 있도록 부호화 모드를 결정하여 모든 블록 모드에 대해 율-왜곡값을 계산해야 하는 비효율을 개선한다.

이를 위해, 부호화기에 일종의 하드웨어 또는 소프트웨어 모듈로서 구현될 수 있으며, 도 2를 통해 전술한 본 발명의 일 실시예에 따른 시공간적 복잡도를 이용한 부호화 모드 결정 장치가 매크로 블록의 시간적 복잡도와 공간적 복잡도를 계산하여 최소 개수의 부호화 모드를 결정하고, 부호화기는 이와 같이 결정된 최소 개수의 부호화 모드에 대해 율-왜곡 최적화 기법을 수행하여 율-왜곡값을 계산하여 최종 부호화 모드를 결정한다.

이하에서는 도 3을 통해 본 발명의 일 실시예에 따른 시공간적 복잡도를 이용한 부호화 모드 결정 장치가 부호화 모드를 결정하는 과정에 대해 설명한다.

도 3은 본 발명의 일 실시예에 따른 시공간적 복잡도를 이용한 부호화 모드 결정 방법을 설명하기 위한 순서도이다.

본 발명의 일 실시예에 따른 시공간적 복잡도를 이용한 부호화 모드 결정 장치(이하 설명의 편의를 위해, '부호화 모드 결정 장치'라 약칭함)는 매크로 블록의 시간적 복잡도를 계산하고(S310), 매크로 블록의 공간적 복잡도를 계산한다(S320).

매크로 블록의 시간적 복잡도와 공간적 복잡도를 계산한 부호화 모드 결정 장치는 시간적 복잡도를 기 설정한 시간 임계치와 비교함으로써 시간적 복잡도가 시간 임계치보다 큰지 여부를 확인하여(S330), 시간적 복잡도가 시간 임계치보다 큰 경우에는 인트라 블록 모드를 부호화 모드로서 결정하고(S340), 시간적 복잡도가 시간 임계치보다 작거나 같은 경우에는 인터 블록 모드를 부호화 모드로서 결정한다(S342).

즉, 부호화 모드 결정 장치는 현재 프레임의 현재의 매크로 블록의 시간적 복잡도가 이전 프레임의 이전 매크로 블록의 시간적 복잡도보다 큰 경우에는 율-왜곡값을 계산하여 부호화 모드를 결정한다고 해도 인트라 블록 모드가 부호화 모드로서 결정될 확률이 높으므로 인트라 블록 모드를 부호화 모드로서 결정하고 그 반대의 경우에는 인터 블록 모드를 부호화 모드로서 결정하는 것이다.

또한, 부호화 모드 결정 장치는 공간적 복잡도를 기 설정한 공간 임계치와 비교함으로써 공간적 복잡도가 공간 임계치보다 큰지 여부를 확인하여(S350), 공간적 복잡도가 공간적 임계치보다 큰 경우에는 소형 블록 모드를 부호화 모드로서 결정하고(S360), 공간적 복잡도가 공간적 임계치보다 작거나 같은 경우에는 대형 블록 모드를 부호화 모드로서 결정한다(S362).

즉, 부호화 모드 결정 장치는 현재 프레임의 현재의 매크로 블록의 공간적 복잡도가 이전 프레임의 이전 매크로 블록의 공간적 복잡도보다 큰 경우에는 율-왜곡값을 계산하여 부호화 모드를 결정한다고 해도 소형 블록 모드가 부호화 모드로서 결정될 확률이 높으므로 소형 블록 모드를 부호화 모드로서 결정하고 그 반대의 경우에는 대형 블록 모드를 부호화 모드로서 결정하는 것이다.

또한, 부호화 모드 결정 장치는 공간적 복잡도에 포함된 수직 복잡도와 수평 복잡도를 비교함으로써 수직 복잡도가 수평 복잡도보다 큰지 여부를 확인하여(S370), 수직 복잡도가 수평 복잡도보다 큰 경우에는 수직 방향성 블록 모드를 부호화 모드로서 결정하고(S372), 수직 복잡도와 수평 복잡도가 동일한 경우에는 비 방향성 블록 모드를 부호화 모드로서 결정하며(S374), 수직 복잡도가 수평 복잡도보다 작은 경우에는 수평 방향성 블록 모드를 부호화 모드로서 결정한다(S376).

즉, 부호화 모드 결정 장치는 현재 프레임이 현재의 매크로 블록의 수직 복잡도가 수평 복잡도보다 큰 경우에는 율-왜곡값을 계산하여 부호화 모드를 결정한다고 해도 수직 방향성 블록 모드가 부호화 모드로서 결정될 확률이 높으므로 수직방향성 블록 모드를 부호화 모드로서 결정하고 동일한 경우에는 비 방향성 블록 모드를 그리고 그 작은 경우에는 대형 블록 모드를 부호화 모드로서 결정하는 것이다.

이와 같이, 부호화 모드 결정 장치는 시간적 복잡도, 공간적 복잡도, 공간적 복잡도에 포함된 수직 복잡도와 수평 복잡도 등을 이용하여 부호화 모드를 결정한다.

한편, 도 3을 통해서는 부호화 모드를 결정하는 데 있어서, 시간적 복잡도를 이용하여 부호화 모드를 결정하는 과정(단계 S330 내지 단계 S342), 공간적 복잡도를 이용하여 부호화 모드를 결정하는 과정(단계 S350 내지 단계 S362) 및 공간적 복잡도에 포함된 수직 복잡도와 수평 복잡도를 모두 이용하여 부호화 모드를 결정하는 과정(단계 S360 내지 단계 S376)을 모두 수행하는 것으로 설명했지만, 이러한 각 과정은 하나 또는 두 개만이 선택적으로 수행될 수도 있고 세 개의 과정이 모두 수행될 수 있으며, 그 수행되는 순서도 임의로 결정될 수 있다.

따라서, 예를 들어 도 3에 도시한 바와 같이 세 개의 과정이 순서대로 수행되어 시간적 복잡도를 이용하여 인트라 블록 모드가 결정되고 공간적 복잡도를 이용하여 소형 블록 모드가 결정되며 수직 복잡도와 수평 복잡도를 이용하여 수직 방향성 블록 모드가 결정된 것으로 가정하면, 부호화 모드로서 결정되는 블록 모드는 표 1에서 '소형 수직 방향성 인트라 블록 모드'로 분류되는 '인트라 4X4_Vertical', '인트라 4X4_Vertical Right' 및 '인트라 4X4_Vertical Left'가 된다. 즉, 부호화기는 전술한 세 개의 블록 모드에서만 율-왜곡값을 계산하여 최종 부호화 모드를 결정하고 최종 부호화 모드로 영상을 압축한다.

또한, 예를 들어, 부호화 모드 결정 장치가 수직 복잡도와 수평 복잡도를 모두 이용하여 부호화 모드를 결정하는 과정(단계 S360 내지 단계 S376)을 수행하여 수평 방향성 블록 모드가 부호화 모드로서 결정된 후 시간적 복잡도를 이용하여 부호화 모드를 결정하는 과정(단계 S330 내지 단계 S342)을 수행하여 인터 블록 모드가 부호화 모드로서 결정된 것으로 가정하면, 부호화 모드로서 결정되는 블록 모드는 '수평 방향성 인터 블록 모드(즉, '대형 수평 방향성 인터 블록 모드'와 '소형 수평 방향성 인터 블록 모드')'인 '인터 16X8'과 '인터 8X4'가 된다. 즉, 부호화기는 전술한 두 개의 블록 모드에서만 율-왜곡값을 계산하여 최종 부호화 모드를 결정하고 최종 부호화 모드로 영상을 압축한다.

4A는 시간적 복잡도를 계산하기 위해 사용되는 아다마드 변환(Hadamard Transform) 행렬을 나타낸 것이다.

부호화 모드 결정 장치는 매크로 블록의 시간적 복잡도를 계산하기 위해, 매크로 블록에 움직임 보상을 수행하여 중복성을 제거함으로써 레지듀얼 신호의 행렬인 블록 레지듀얼을 계산하고, 블록 레지듀얼에 1A에 나타낸 아다마드 변환 행렬을 곱하여 아다마드 변환을 수행함으로써 시간적 블록 복잡도를 계산한다. 또한, 부호화 모드 결정 장치는 시간적 블록 복잡도를 양자화 폭으로 나누어 시간적 복잡도를 계산한다. 여기서 매크로 블록은 매크로 블록의 픽셀(Pixel)값을 갖는 16X16의 행렬을 말한다. 이와 같은 과정은 수학식 2와 같이 표시할 수 있다.

수학식 2

본 발명에서는 움직임 보상에 의해 매크로 블록의 중복성을 제거한 후, 아다마드 변환을 추가로 수행하여 레지듀얼 신호 상의 중복성을 한 번 더 제거함으로써 실제 비트 발생량의 오차를 획기적으로 감소시킨다.

즉, 아다마드 변환은 입력 신호를 주파수로 분해하는 기능이 있으므로 아다마드 변환을 거친 레지듀얼 신호는 총 16 개의 주파수로 분해되며, 이와 같이 분해된 주파수는 실제 부호화 과정에서 신호를 압축하기 위해 사용되는 이산 코사인 변환(DCT: Discrete Cosine Transform)의 주파수 분해된 결과물과 매우 근사한 값을 갖게 된다. 따라서, 부호화 모드 결정 장치는 아다마드 변환을 통해 분해된 주파수를 이용하여 시간상으로 유사성을 갖는 이전 프레임과의 차분 신호를 발생하는 데이터량을 매우 정확하게 예측할 수 있고, 이를 통해 시간적 복잡도를 매우 정확하게 계산할 수 있다.

4B는 공간적 복잡도를 계산하기 위해 사용되는 수직 필터(Vertical Filter)를 나타낸 것이고, 4C는 공간적 복잡도를 계산하기 위해 사용되는 수평 필터(Horizontal Filter)를 나타낸 것이다.

부호화 모드 결정 장치는 공간적 복잡도를 계산하기 위해, 매크로 블록에 4B에 도시한 수직 필터를 곱함으로써 매크로 블록을 수직 필터링하여 매크로 블록의 수직 복잡도를 계산하고, 매크로 블록에 4C에 도시한 수평 필터를 곱하여 매크로 블록을 수평 필터링하여 매크로 블록의 수평 복잡도를 계산한다. 또한, 부호화 모드 결정 장치는 수직 복잡도와 수평 복잡도를 더한 값을 2로 나누어 공간적 블록 복잡도를 계산하고, 공간적 블록 복잡도를 양자화 폭으로 나누어 공간적 복잡도를 계산한다. 여기서 매크로 블록은 매크로 블록의 픽셀(Pixel)값을 갖는 16X16의 행렬을 말한다. 이와 같은 과정을 수학식 3과 같이 표시할 수 있다.

수학식 3

본 발명에서는 2차원의 5 개의 탭(Tap)을 갖는 필터들(즉, 수직 필터와 수평 필터)을 사용하여 공간적 복잡도를 계산한다. 공간적 복잡도는 인트라 예측이 사용된 경우의 비트 발생량을 높은 정확도로 예측하고자 계산하는 것이다.

통상적인 공간적 복잡도를 계산하는 방식에서는 매크로 블록의 인접한 화소들의 차이를 구한 후 그 차이의 총 합을 이용하여 단순하게 복잡도를 계산한다. 하지만, 본 발명에서는 2차원으로 구성되는 고역 통화 필터(High Pass Filter, 즉 수직 필터 및 수평 필터)를 이용하여 화소의 위치에 따라 그 중요도에 가중치를 두어 검출을 시행하여 부호화기의 입력 영상에 존재하는 모서리(Edge)를 검출하도록 한다. 모서리는 다양한 방향성을 가질 수 있으므로 수평 필터와 수직 필터를 모두 사용하여 필터링하며, 이를 합산하여 수평 방향과 수직 방향뿐만 아니라 대각선 방향들에 대해서도 모서리를 검출할 수 있다.

또한, 본 발명에서는 실제 부호화 과정에서 비트 발생량을 조절하는 데 매우 중요하게 이용되는 양자화 폭을 공간적 복잡도를 계산하는 데 사용함으로써, 더욱 정확하게 공간적 복잡도를 계산한다. 즉, 매크로 블록을 수직 필터링한 값과 수평 필터링한 값을 더한 후 양자화 폭으로 나누어 공간적 복잡도를 계산하므로, 양자화 폭에 따라 변화할 수 있는 비트 발생량과 공간적 복잡도 사이에 발생할 수 있는 오차를 획기적으로 감소시킬 수 있다. 이러한 접근은 인트라 예측에서 다양한 예측 방향(Prediction Direction) 중 가장 효율적인 것만을 선별하는 데 사용되며, 이를 통해 부호화 모드를 더욱 정확하게 결정할 수 있다.

이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.

이상에서 설명한 바와 같이 본 발명은 율-왜곡 최적화 기법을 이용하여 매크로 블록에 대해서 최적의 부호화 모드를 결정하는 데 있어서, 율-왜곡값의 계산을 최소로 하기 위한 부호화 모드를 결정하는 방법 및 장치분야에 적용되어, 매크로 블록에 대한 시간적 복잡도와 공간적 복잡도를 더욱 정확하게 계산할 수 있을 뿐만 아니라 그를 이용하여 최적의 부호화 모드를 선별함으로써 율-왜곡 최적화 기법을 적용할 때의 계산의 복잡도를 줄이고 처리 속도를 향상할 수 있는 효과를 발생하는 매우 유용한 발명이다.

CROSS-REFERENCE TO RELATED APPLICATION

본 특허출원은 2008.01. 24.에 한국에 출원한 특허출원번호 제 10-2008-0007666 호에 대해 미국 특허법 119(a)조(35 U.S.C § 119(a))에 따라 우선권을 주장하면, 그 모든 내용은 참고문헌으로 본 특허출원에 병합된다.(This non-provisional application claims priorities under 35 U.S.C § 119(a) on Patent Application No.10-2008-0007666 filed in Korea on January 24, 2008, the entire contents of which are hereby incorporated by reference.) 아울러, 본 특허출원은 미국 이외에 국가에 대해서도 위와 동일한 동일한 이유로 우선권을 주장하면 그 모든 내용은 참고문헌으로 본 특허출원에 병합된다.

Claims

부호화 모드를 결정하는 장치에 있어서,

매크로 블록의 시간적 복잡도를 계산하는 시간적 복잡도 계산부; 및

상기 시간적 복잡도를 이용하여 상기 부호화 모드를 결정하는 모드 결정부

를 포함하는 것을 특징으로 하는 시간적 복잡도를 이용한 부호화 모드 결정 장치.
제 1 항에 있어서, 상기 모드 결정부는,

상기 시간적 복잡도가 기 설정된 시간 임계치보다 큰 경우에는 인트라 블록 모드를 상기 부호화 모드로서 결정하는 것을 특징으로 하는 시간적 복잡도를 이용한 부호화 모드 결정 장치.
제 1 항에 있어서, 상기 모드 결정부는,

상기 시간적 복잡도가 기 설정된 시간 임계치보다 작거나 같은 경우에는 인터 블록 모드를 상기 부호화 모드로서 결정하는 것을 특징으로 하는 시간적 복잡도를 이용한 부호화 모드 결정 장치.
제 2 항 또는 제 3 항에 있어서, 상기 시간 임계치는,

상기 매크로 블록을 포함하는 현재 프레임의 이전 프레임에서 상기 매크로 블록과 동일한 위치를 갖는 이전 매크로 블록의 시간적 복잡도인 것을 특징으로 하는 시간적 복잡도를 이용한 부호화 모드 결정 장치.
제 1 항에 있어서, 상기 시간적 복잡도 계산부는,

상기 매크로 블록의 블록 레지듀얼을 아다마드 변환하고 양자화 폭으로 나누어 상기 시간적 복잡도를 계산하는 것을 특징으로 하는 시간적 복잡도를 이용한 부호화 모드 결정 장치.
부호화 모드를 결정하는 장치에 있어서,

매크로 블록의 공간적 복잡도를 계산하는 공간적 복잡도 계산부; 및

상기 공간적 복잡도를 이용하여 상기 부호화 모드를 결정하는 모드 결정부

를 포함하는 것을 특징으로 하는 공간적 복잡도를 이용한 부호화 모드 결정 장치.
제 6 항에 있어서, 상기 모드 결정부는,

상기 공간적 복잡도가 기 설정된 공간 임계치보다 큰 경우에는 소형 블록 모드를 상기 부호화 모드로서 결정하는 것을 특징으로 하는 공간적 복잡도를 이용한 부호화 모드 결정 장치.
제 6 항에 있어서, 상기 모드 결정부는,

상기 공간적 복잡도가 기 설정된 공간 임계치보다 작거나 같은 경우에는 대형 블록 모드를 상기 부호화 모드로서 결정하는 것을 특징으로 하는 공간적 복잡도를 이용한 부호화 모드 결정 장치.
제 7 항 또는 제 8 항에 있어서, 상기 공간 임계치는,

상기 매크로 블록을 포함하는 현재 프레임의 이전 프레임에서 상기 매크로 블록과 동일한 위치를 갖는 이전 매크로 블록의 공간적 복잡도인 것을 특징으로 하는 공간적 복잡도를 이용한 부호화 모드 결정 장치.
제 6 항에 있어서,

상기 공간적 복잡도는 상기 매크로 블록의 수직 복잡도 및 상기 매크로 블록의 수평 복잡도를 포함하되, 상기 모드 결정부는 상기 수직 복잡도가 상기 수평 복잡도보다 큰 경우에는 수직 방향성 블록 모드를 상기 부호화 모드로서 결정하는 것을 특징으로 하는 공간적 복잡도를 이용한 부호화 모드 결정 장치.
제 6 항에 있어서,

상기 공간적 복잡도는 상기 매크로 블록의 수직 복잡도 및 상기 매크로 블록의 수평 복잡도를 포함하되, 상기 모드 결정부는 상기 수직 복잡도와 상기 수평 복잡도가 동일한 경우에는 비 방향성 블록 모드를 상기 부호화 모드로서 결정하는 것을 특징으로 하는 공간적 복잡도를 이용한 부호화 모드 결정 장치.
제 6 항에 있어서,

상기 공간적 복잡도는 상기 매크로 블록의 수직 복잡도 및 상기 매크로 블록의 수평 복잡도를 포함하되, 상기 모드 결정부는 상기 수직 복잡도가 상기 수평 복잡도보다 작은 경우에는 수평 방향성 블록 모드를 상기 부호화 모드로서 결정하는 것을 특징으로 하는 공간적 복잡도를 이용한 부호화 모드 결정 장치.
제 6 항에 있어서, 상기 공간적 복잡도 계산부는,

상기 매크로 블록의 수직 복잡도 및 상기 매크로 블록의 수평 복잡도의 합을 양자화 폭으로 나누어 상기 공간적 복잡도를 계산하는 것을 특징으로 하는 공간적 복잡도를 이용한 부호화 모드 결정 장치.
부호화 모드를 결정하는 장치가 상기 부호화 모드를 결정하는 방법에 있어서,

(a) 매크로 블록의 시간적 복잡도를 계산하는 단계;

(b) 상기 매크로 블록의 공간적 복잡도를 계산하는 단계;

(c) 상기 시간적 복잡도가 기 설정된 시간 임계치보다 큰 경우에는 인트라 블록 모드를 상기 부호화 모드로서 결정하는 단계; 및

(d) 상기 시간적 복잡도가 상기 시간 임계치보다 작거나 같은 경우에는 인터 블록 모드를 상기 부호화 모드로서 결정하는 단계

를 포함하는 것을 특징으로 하는 시공간적 복잡도를 이용한 부호화 모드 결정 방법.
제 14 항에 있어서, 상기 부호화 모드 결정 방법은,

상기 단계 (b) 이후에,

(e) 상기 공간적 복잡도가 기 설정된 공간 임계치보다 큰 경우에는 소형의 블록 모드를 상기 부호화 모드로서 결정하는 단계; 및

(f) 상기 공간적 복잡도가 상기 공간 임계치보다 작거나 같은 경우에는 대형의 블록 모드를 상기 부호화 모드로서 결정하는 단계

를 추가로 포함하는 것을 특징으로 하는 시공간적 복잡도를 이용한 부호화 모드 결정 방법.
제 15 항에 있어서, 상기 부호화 모드 결정 방법은,

상기 단계 (b) 이후에,

(g) 상기 공간 복잡도를 이용하여 상기 매크로 블록의 수직 복잡도와 상기 매크로 블록의 수평 복잡도를 비교하는 단계;

(h) 상기 매크로 블록의 수직 복잡도가 상기 매크로 블록의 수평 복잡도보다 큰 경우에는 수직 방향성 블록 모드를 상기 부호화 모드로서 결정하는 단계;

(i) 상기 매크로 블록의 수직 복잡도가 상기 매크로 블록의 수평 복잡도와 동일한 경우에는 비 방향성 블록 모드를 상기 부호화 모드로서 결정하는 단계; 및

(j) 상기 매크로 블록의 수직 복잡도가 상기 매크로 블록의 수평 복잡도보다 작은 경우에는 수평 방향성 블록 모드를 상기 부호화 모드로서 결정하는 단계

를 추가로 포함하는 것을 특징으로 하는 시공간적 복잡도를 이용한 부호화 모드 결정 방법.
제 14 항에 있어서, 상기 단계 (a)에서, 상기 부호화 모드 결정 장치는,

상기 매크로 블록의 블록 레지듀얼을 아다마드 변환하고 양자화 폭으로 나누어 상기 시간적 복잡도를 계산하는 것을 특징으로 하는 시공간적 복잡도를 이용한 부호화 모드 결정 방법.
제 14 항에 있어서, 상기 단계 (b)에서, 상기 부호화 모드 결정 장치는,

상기 매크로 블록의 수직 복잡도 및 상기 매크로 블록의 수평 복잡도의 합을 양자화 폭으로 나누어 상기 공간적 복잡도를 계산하는 것을 특징으로 하는 시공간적 복잡도를 이용한 부호화 모드 결정 방법.