KR101155767B1

KR101155767B1 - 비디오 데이터의 인코딩을 위한 인코딩 유형 및 예측 모드선택

Info

Publication number: KR101155767B1
Application number: KR1020050055777A
Authority: KR
Inventors: 통 씬; 니에 씨아오쿤
Original assignee: 애플 인크.
Priority date: 2004-06-27
Filing date: 2005-06-27
Publication date: 2012-06-12
Also published as: JP4949647B2; CN101945280B; US20100290526A1; JP2006014342A; US8018994B2; KR20100038335A; CN101945280A; KR101208863B1; JP5711405B2; KR20120004370A; US20050286630A1; EP1610563A3; TW200623885A; US8472516B2; TWI350697B; JP2014161094A; KR101152576B1; JP5559900B2; JP2013153515A; US20110286522A1

Abstract

비디오 프레임의 매크로블록에 대한 인코딩 유형 선택과 예측 모드(들) 선택을 결정하는 방법이 제공된다. 몇몇 실시예들에서, 일반 방법은 1) 인코딩 유형 선택 알고리즘을 사용하여(계산하기에 용이한 매크로블록의 속성에 기초하여) 매크로블록에 대하여 초기 고려되는 인코딩 유형(16×16 또는 4×4)을 선택하고, 2) 16×16 인코딩 유형이 단계 1에서 선택되는 경우, 종래 방법을 사용하여 매크로블록 상에 사용될 수 있는 4개의 16×16 예측 모드 또는 왜곡 임계치에 기초하는 개선된 16×16 예측 모드 검색 알고리즘을 고려하며, 3) 4×4 인코딩 유형이 단계 1에서 선택된 경우, 종래 방법을 사용하여 매크로블록의 16개의 4×4 블록 각각에 사용될 4×4 예측 모드 또는 예측 모드들 간의 위치 관계에 기초하는 개선된 4×4 예측 모드 검색 알고리즘을 선택한다.

예측 모드, 매크로블록, 인코딩 유형, 왜곡 임계치, 비디오 데이터

Description

비디오 데이터의 인코딩을 위한 인코딩 유형 및 예측 모드 선택{SELECTING ENCODING TYPES AND PREDICTIVE MODES FOR ENCODING VIDEO DATA}

도 1은 매크로블록 화소에 대한 인코딩 유형과 예측 모드(들)를 선택하는 일반적인 방법의 흐름도.

도 2는 매크로블록 화소에 대한 인코딩 유형을 선택하는 인코딩 유형 선택 방법의 흐름도.

도 3은 16×16 매크로블록의 화소의 예측 모드를 선택하는 16×16 예측 모드 검색 방법의 흐름도.

도 4는 4×4 어레이의 9개의 예측 모드 간의 논리/위치 관계를 나타내는 개념도.

도 5는 4×4 어레이의 매크로블록에 대한 예측 모드를 선택하는 4×4 예측 모드 검색 방법의 흐름도.

도 6은 4×4 어레이의 매크로블록에 대한 예측 모드를 선택하는 다른 4×4 예측 모드 검색 방법의 흐름도.

도 7은 본 발명의 몇몇 실시예들이 구현되는 컴퓨터 시스템을 제시하는 도면.

<도면의 주요 부분에 대한 부호의 설명>

710 : 프로세서

715 : 시스템 메모리

720 : ROM

725 : 스토리지

730 : 입력 장치

735 : 출력 장치

765 : 네트워크

본 출원은 2004년 6월 27일에 출원되고 발명의 명칭이 "Encoding and Decoding Images"인 미국특허 가출원번호 제60/583,447호를 우선권으로 주장한다.

본 발명은 비디오 데이터를 인코딩하기 위한 인코딩 유형과 예측 모드를 선택하는 것에 관한 것이다.

비디오 스트림은 각 프레임이 다수의 매크로블록으로 이루어지는 일련의 비디오 프레임으로 이루어진다. 각 매크로블록은 통상 16×16 어레이의 화소이지만, 다른 크기의 매크로블록도 또한 가능하다. 비디오 코덱(압축기-복원기)은 비디오 데이터 스트림을 인코딩/압축 및 디코딩/복원하여 보다 빠른 전송과 보다 작은 스토리지 공간으로 스트림의 크기를 감소하도록 설계된 압축 알고리즘의 소프트웨어, 하드웨어, 또는 소프트웨어와 하드웨어 조합의 구현이다. 손실이 있지만, 비디오 코덱은 비디오 스트림의 이진 데이터를 압축하면서 비디오 품질을 유지하려 시도한다. 널리 사용되는 비디오 코덱의 예는 WMV, RealVideo뿐만 아니라 MPEG-2, MPEG-4, H.261, H.263, 및 H.264D와 같은 압축 표준의 구현예를 포함한다.

H.264 압축 표준하에서, 비디오 프레임의 매크로블록은 16×16 화소 어레이로서 내부 인코딩(intra encoding)될 수 있되, 어레이의 화소값은 이전에 인코딩된 매크로블록으로부터 계산되는 값을 사용하여 예측된다. 16×16 매크로블록은 또한 16개의 4×4 화소 어레이로서 내부 인코딩될 수 있으며, 이 경우 각각의 4×4 어레이에서의 화소 값은 이전에 인코딩된 4×4 어레이(루마 블록(luma block))로부터 계산된 값을 사용하여 예측된다. 16×16 어레이에 대하여 4개의 내부 예측 모드가 가능하고 4×4 어레이(루마 블록)에 있어서는 9개의 내부 예측 모드가 가능하게 된다.

이와 같이, 매크로블록을 인코딩할 때, 두 개의 결정(선택)이 행해진다: 1) 매크로블록이 하나의 16×16 어레이로서 인코딩되어야 하는지(여기서는, 16×16 인코딩이라고 함) 또는 16개의 4×4 어레이로서 인코딩되어야 하는지(여기서는, 4×4 인코딩이라고 함) 여부, 및 2) 매크로블록을 인코딩하는데 사용될 예측 모드(들). 예를 들면, 매크로블록이 16×16 어레이로서 인코딩되어야 한다고 결정되는 경우, 16×16 어레이에 있어서 4개의 예측 모드 중 어느 것이 사용되어야 하는지가 또한 결정되어야 한다. 16개의 4×4 어레이로서 인코딩되어야 한다고 결정되는 경우, 16개의 4×4 어레이에 대하여, 4×4 어레이에 대한 9개의 예측 모드 중 어느 것이 사용되어야 하는지가 또한 결정되어야 한다. 단계 1은 여기서 인코딩 유형 선택이라 하고, 단계 2는 예측 모드 선택이라고 한다.

인코딩 유형 선택과 예측 모드 선택은 비용 함수를 사용하여 행해진다. 예를 들면, 비용 함수는 보다 낮은 비용을 갖는 인코딩 유형(16×16 또는 4×4 인코딩)이 선택되는 경우에 하나의 16×16 어레이 또는 16개의 4×4 어레이로서 인코딩되어야 하는지를 결정하는데 통상 사용된다. 비용은 통상적으로 왜곡 또는 왜곡의 가중 평균과 예측 모드에 의해 생성된 비트수의 추정치의 합과 동일하되, 왜곡 및/또는 비트수의 증가는 비용을 증가시킨다. 왜곡은 원형 화소값과 예측(또는 인코딩된) 값 간의 차이를 반영하고 다양한 방식으로 측정될 수 있다. 예를 들면, 왜곡은 원형 화소값과 예측(인코딩된) 값 간의 차이의 절대값의 합으로서 측정될 수 있다.

매크로블록에 대하여 최적 인코딩 유형(16×16 또는 4×4 인코딩)과 최적 예측 모드(들)를 선택하는 과도 검색(exhaustive search) 접근법은, 매크로블록 내의 16개의 4×4 블록에 대하여 4개의 16×16 예측 모드 전체와 9개의 4×4 예측 모드의 전체 조합의 비용을 결정하되, 최저 비용을 제공하는 4×4 예측 모드의 특정 조합 또는 16×16 예측 모드가 선택되는 것에 관련된다. 각 매크로블록에 있어서, 과도 검색 접근법은 4×4 예측 모드의 9^16개의 상이한 조합의 고려를 요구하기 때문에, 과도 검색 접근법은 실제로는 실행불가능하게 된다.

이에 따라, 매크로블록에 대한 인코딩 유형과 예측 모드(들)를 결정하기 위해 다음 연산이 통상 수행된다:

1) 4개의 가능한 16×16개의 예측 모드 전체 비용을 계산.

2) 16개의 4×4 블록 각각에 대하여, 최저 비용을 갖는 예측 모드를 (9개의 예측 모드 중에서) 선택한 후, 결과적인 조합의 총 비용(즉, 16개의 결정된 비용의 합산 비용)을 계산.

3) 단계 1에서 결정된 비용과 단계 2에서 결정된 비용을 비교하여 최소값을 선택. 이러한 선택은 인코딩 유형 선택과 예측 모드(들) 선택을 모두 제공한다.

그러나, 종래의 접근법은, 또한, 4×4 예측 모드의 9×16개의 상이한 조합에 대한 비용과 4개의 16×16 예측 모드에 대한 비용의 합을 결정하는 것과 관련된다.

몇몇 실시예들에서, 비디오 프레임의 매크로블록에 대한 인코딩 유형 선택과 예측 모드(들) 선택을 결정하는 보다 효율적인 방법이 제공된다. 몇몇 실시예들에서, 일반 방법은 1) 인코딩 유형 선택 알고리즘을 사용하여(계산하기에 용이한 매크로블록의 속성에 기초하여) 매크로블록에 대하여 초기 고려되는 인코딩 유형(16×16 또는 4×4)을 선택하고, 2) 16×16 인코딩 유형이 단계 1에서 선택되는 경우, 종래 방법을 사용하여 매크로블록 상에 사용될 수 있는 4개의 16×16 예측 모드 또는 왜곡 임계치에 기초하는 개선된 16×16 예측 모드 검색 알고리즘을 고려하며, 3) 4×4 인코딩 유형이 단계 1에서 선택된 경우, 종래 방법을 사용하여 매크로블록의 16개의 4×4 블록 각각에 사용될 4×4 예측 모드 또는 예측 모드들 간의 위치 관계에 기초하는 개선된 4×4 예측 모드 검색 알고리즘을 선택한다.

2004년 6월 27일에 출원되어 발명의 명칭이 "Encoding and Decoding Images"인 미국특허 가출원번호 제60/583,447호는 개시 내용이 본원에 참조되어 있다.

후술하는 설명에서, 수많은 세부사항을 예시로서 설명한다. 그러나, 당업자는 본 발명이 이들 특정 세부상의 사용없이 실시될 수 있음을 인식할 것이다. 다른 경우, 공지된 구조 및 장치는 본 발명을 불필요한 세부사항으로 모호하게 하지 않기 위해서 블록도 형태로 도시된다.

몇몇 실시예들에서, 비디오 프레임 내의 매크로블록에 대하여 인코딩 유형 선택과 예측 모드(들) 선택을 결정하는 보다 효율적인 방법이 제공된다. 몇몇 실시예들에서, 일반 검색 알고리즘은 다음 연산을 수행한다:

1) 인코딩 유형 선택 알고리즘을 사용하여(계산하기에 용이한 매크로블록의 속성에 기초하여) 매크로블록에 대하여 초기 고려되는 인코딩 유형(16×16 또는 4×4)을 선택. 이 인코딩 유형 선택 알고리즘은 섹션 I에서 후술한다.

2) 16×16 인코딩 유형이 단계 1에서 선택된 경우, 종래 방법을 사용하여 매크로블록 상에 사용될 수 있는 4개의 16×16 예측 모드 또는 왜곡 임계치에 기초하는 개선된 16×16 예측 모드 검색 알고리즘을 고려. 16×16 예측 모드 검색 알고리즘의 하나의 특정 상황으로, 4×4 인코딩 유형이 사용될 수 있다. 이 단계는 섹션 II에서 후술한다.

3) 4×4 인코딩 유형이 단계 1에서 선택된 경우, 종래 방법을 사용하여 매크로블록의 16개의 4×4 블록 각각에 사용될 4×4 예측 모드 또는 (섹션 III에서 후술하는 바와 같이)예측 모드들 간의 위치 관계에 기초하는 개선된 4×4 예측 모드 검색 알고리즘을 선택.

검색 알고리즘의 단계 1에서, 인코딩 유형 선택 알고리즘이 초기 고려에서 16×16 인코딩 유형을 선택한 경우, 궁극적으로 선택되는 인코딩 유형은 16×16 인코딩 유형이거나 4×4 인코딩 유형일 수 있다. 반면에, 인코딩 유형 선택 알고리즘이 초기 고려에서 4×4 인코딩 유형을 선택한 경우, 4×4 인코딩 유형은 매크로블록에 대하여 인코딩 유형으로서 유효하게 선택된다. 16×16 인코딩 유형이 초기 고려에서 선택된 경우, 종래 방법 또는 개선된 16×16 예측 모드 검색 알고리즘이 그 후 매크로블록에 대한 예측 모드(들)를 결정하는데 사용된다. 4×4 인코딩 유형이 초기 고려에서 선택되는 경우, 종래 방법 또는 개선된 4×4 예측 모드 검색 알고리즘이 그 후 매크로블록에 대한 예측 모드(들)를 결정하는데 사용된다. 이와 같이, 검색 알고리즘에 의해 초기 고려에서 어떤 인코딩 유형이 선택되는지에 따라, (종래의 또는 개선된) 상이한 검색 알고리즘이 예측 모드를 결정하는데 사용된다.

도 1은 매크로블록 화소에 대한 인코딩 유형과 예측 모드(들)를 선택하는 일반적인 방법(100)의 흐름도이다. 몇몇 실시예들에서, 일반적인 방법(100)은 비디오 프레임을 인코딩하도록 구성된 소프트웨어 및/또는 하드웨어로 구현된다. 이 방법은 (102에서)매크로블록 화소를 수신하는 경우에 개시한다. 몇몇 실시예들에서, 매크로블록은 16×16 어레이의 화소이지만, 다른 실시예들에서는, 매크로블록은 상이한 크기의 화소 어레이이다. 몇몇 실시예들에서, 매크로블록은 4개의 8×8 어레이 또는 16개의 4×4 어레이로 분할되지만, 다른 실시예들에서는, 매크로블록 은 상이한 크기의 블록/어레이로 분할된다.

그 후, 이 방법은 (105에서) (도 2를 참조하여 후술하는) 인코딩 유형 선택 방법(200)을 사용하여 매크로블록에서 초기 고려되는 인코딩 유형(16×16 또는 4×4)을 선택한다. 그 후, 이 방법은 (110에서) 4×4 인코딩 유형이 선택되었는지를 판정한다. 그러한 경우, 이 방법은 (115에서) 종래 방법, (도 5를 참조하여 후술하는)개선된 4×4 예측 모드 검색 방법(500), 또는 (도 6을 참조하여 후술하는) 다른 4×4 예측 모드 검색 방법(600)을 사용하여 매크로블록의 16개의 4×4 블록 각각에 대하여 예측 모드를 선택한다.

이 방법이 4×4 인코딩 유형이 선택되지 않았음을 판정하는 경우(110에서, 아니오), 그 후 (120에서)(도 3을 참조하여 후술하는 바와 같이, 종래 방법 또는 개선된 16×16 예측 모드 검색 방법(300)을 사용하여) 16×16 예측 모드 또는 4×4 인코딩 유형을 선택한다. 그 후, 이 방법은 (120에서) 4×4 인코딩 유형이 선택되었는지를 판정한다(125에서). 그러한 경우, 이 방법은 매크로블록의 16개의 4×4 블록 각각에 대한 예측 모드가 선택되는 단계 115로 진행한다. 이 방법이 4×4 인코딩 유형이 선택되지 않았음을 판정하는 경우(125에서, 아니오), 이는 16×16 예측 모드가 선택되었음을 의미한다. 그 후, 이 방법은 종료한다.

섹션 I: 인코딩 유형 선택 알고리즘

본 섹션은 일반 검색 알고리즘의 단계 1의 인코딩 유형 선택 알고리즘을 설명한다. 이 인코딩 유형 선택 알고리즘은 매크로블록에 대하여 초기 고려되는 인코딩 유형(16×16 또는 4×4)을 선택하고 이에 따라 어느 예측 모드(16×16 모드 또는 4×4 모드)가 매크로블록에 대하여 초기 고려되는지를 결정한다. 인코딩 유형 선택 알고리즘은 결정하기에 용이한 매크로블록의 속성을 사용한다.

인코딩 유형 선택 알고리즘은 다음 연산을 수행한다.

1) 매크로블록은 4개의 8×8 블록으로 나누어진다.

2) 각각의 8×8 블록에 대한 분산이 계산되고 소정 임계치와 비교된다. 예를 들면, 소정 임계치는 매크로블록이 포함되는 프레임 내의 모든 8×8 블록의 평균 분산과 동일하게 설정될 수 있다. 8×8 블록의 분산은, 예를 들면, a) 블록 내의 모든 화소값의 평균을 결정, b) 블록 내의 각 화소에 대하여 (화소값 - 평균)^2를 결정, 및 c) 단계 b에서 결정된 모든 값을 합산(즉, 블록 내의 모든 화소에 대하여 결정된 값 전체를 합산)함으로써 결정될 수 있다.

3) (매크로블록이 하나의 16×16 블록 또는 16개의 4×4 블록으로서 인코딩되어야 하는지를 결정하는데 사용되는 속성인)소정 임계치보다 적은 분산을 갖는 매크로블록 내의 8×8 블록의 개수를 결정.

4) 4개의 8×8 블록이 모두 소정 임계치 이하의 분산을 갖는 경우, 초기 고려에서 16×16 인코딩 유형이 선택된다. 16×16 인코딩 유형이 초기 고려에서 선택되는 경우, 궁극적으로 선택되는 인코딩 유형은 16×16 인코딩 유형이거나 4×4 인코딩 유형일 수 있다. 매크로블록 상에서 사용될 16×16 예측 모드는 종래 방법 또는 (섹션 II에서 후술하는 바와 같은) 개선된 16×16 예측 모드 검색 알고리즘을 사용하여 선택될 수 있다.

5) 4개의 8×8 블록 중 임의의 것이 소정 임계치보다 큰 분산을 갖는 경우, 4×4 인코딩 유형이 선택된다. 이에 의해, 매크로블록의 16개의 4×4 블록 각각에 사용될 4×4 예측 모드는 그 후 종래 방법 또는 (섹션 III에서 후술하는 바와 같은) 개선된 4×4 예측 모드 검색 알고리즘을 사용하여 결정될 수 있다.

인코딩 프로세스의 양자화 단계에서 사용되는 양자화 매개변수 값이 비교적 큰 경우(예를 들면, 34 이상), 인코딩 유형 선택 알고리즘의 연산은 상기 설명에서 약간 벗어나게 된다. 이들 실시예들에서, 소정 임계치는 양자화 매개변수 값(QP)에 따른 인자에 의해 스케일되기때문에, 양자화 매개변수 값이 증가함에 따라 소정 임계치가 증가하게 된다. 몇몇 실시예들에서, 스케일링 인자(scaling factor)는 (1+k(QP-34)) 형태의 스케일링 식으로 결정되며, 여기서, k는 상수이다. 다른 실시예들에서, 스케일링 인자는 다른 스케일링 식에 의해 결정된다. 그 후, 소정 임계치는 결정된 스케일링 인자와 승산되어 스케일된 임계치를 생성한다.

이들 실시예들에서, 4개의 8×8 블록 중 임의의 것이 스케일된 임계치보다 큰 분산을 갖는 경우, 매크로블록은 16개의 4×4 블록으로서 인코딩된다. 이러한 선택은 종래 방법 또는 (개선된 4×4 예측 모드 검색 알고리즘과 같은) 본 발명의 방법을 사용하여 행해질 수 있다. 그러나, 매크로블록의 4개의 8×8 블록 모두가 스케일된 임계치보다 적은 분산을 갖는 경우에는, 매크로블록은 하나의 16×16 블록 또는 16개의 4×4 블록으로서 인코딩될 수 있다. 매크로블록 상에서 사용될 16×16 예측 모드는 그 후 종래 방법 또는 (섹션 III에서 후술하는 바와 같은) 개선된 16×16 예측 모드 검색 알고리즘을 사용하여 선택될 수 있다. 4×4 인코딩 유형이 선택된 16×16 예측 모드에 대하여 선택된 경우에는, 4×4 예측 모드가 종래 의 방법 또는 (개선된 4×4 예측 모드 선택 알고리즘과 같은) 본 발명의 방법을 사용하여 선택될 수 있다.

도 2는 매크로블록 화소에 대한 인코딩 유형을 선택하는 인코딩 유형 선택 방법(200)의 흐름도이다. 몇몇 실시예들에서, 방법(200)은 비디오 프레임을 인코딩하도록 구성된 소프트웨어 및/또는 하드웨어로 구현된다. 몇몇 실시예들에서, 인코딩 유형 선택 방법(200)은 도 1의 단계 105를 포함한다. 방법(200)은 (205에서)매크로블록에 대한 임계치 분산을 결정함으로써 개시한다. 몇몇 실시예들에서, 임계치 분산은 (후술한 바와 같이)매크로블록이 포함되는 프레임 내에서 모든 8×8 블록의 평균 분산과 동일하게 설정된다. 다른 실시예들에서, 인코딩 프로세스의 양자화 단계에서 사용된 양자화 매개변수 값이 비교적 큰 경우, 결정된 임계치 분산은 (상술한 바와 같이)양자화 매개변수 값에 의존하는 인자에 의해 스케일된다.

그 후, 이 방법은 (210에서) 4개의 8×8 블록으로 매크로블록을 나누고, (215에서) 4개의 8×8 블록 각각에 대한 분산을 결정한다. 그 후, 이 방법은 (220에서) 4개의 8×8 블록의 모든 분산이 임계치 분산보다 적은 지를 판정한다. 그러한 경우, 이 방법은 (225에서) 매크로블록에 대하여 16×16 인코딩 유형을 선택하여 종료한다. 그렇지 않은 경우, 이 방법은 (230에서) 매크로블록에 대하여 4×4 인코딩 유형을 선택하여 종료한다.

섹션 II: 16×16 예측 모드 검색 알고리즘

일반 검색 알고리즘의 단계 1 후에, 16×16 인코딩 유형이 초기 고려에서 선택된 경우, 16×16 인코딩 유형 예측 모드가 검사된다. 본 섹션은 일반 검색 알고 리즘의 단계 2를 설명한다. H.264 코덱 표준하에서, DC, V(수직), H(수평), 및 P(평면)로부터 선택하는 4개의 16×16 내부 예측 모드가 가능하다. 몇몇 실시예들에서, 종래 방법은 (예를 들면, 4개의 16×16 예측 모드 각각의 비용을 결정하여 최저 비용을 갖는 모드를 선택함으로써)16×16 예측 모드를 선택하는데 사용된다. 다른 실시예들에서, 개선된 16×16 예측 모드 선택 알고리즘은 예측 모드에서 야기된 왜곡에 기초하여 매크로블록에 대한 16×16 예측 모드를 고려(즉, 검사)하는데 사용된다.

몇몇 실시예들에서, 16×16 예측 모드 검색 알고리즘은 종래 방법을 사용하여 현재 처리되는 매크로블록에 적용되는 바와 같이 특정 예측 모드에 의해 야기된 왜곡을 결정한다. 종래 방법에서, 이 왜곡은 1) 인접하는 이전에 인코딩된 매크로블록으로부터 화소값을 검색, 2) 검색된 화소값으로부터 새로운 값을 유도, 3) 유도된 값을 사용하여 현재 처리되는 매크로블록에 대한 예측 값을 계산, 및 4) 현재 처리되는 매크로블록의 원형 화소값과 계산된 예측값 간의 왜곡을 결정함으로써 결정된다. 그러나, 종래 방법을 사용한 왜곡의 결정은 시간 소모적이다.

다른 실시예들에서, 16×16 예측 모드 검색 알고리즘은 보다 빠른 추정 방법을 사용하여 현재 처리되는 매크로블록에 인가되는 적용되는 바와 같이 특정 예측 모드에 의해 야기된 왜곡을 결정한다. 이 추정 방법은 특정 예측 모드에 의해 생성될 수 있는 예측값의 추정치(에뮬레이션)을 제공한 후, 이 추정된 예측값의 왜곡을 결정한다.

추정 방법하에서, 경계에서의 현재 처리되는 매크로블록의 화소값이 주변 매 크로블록으로부터 인접한 화소값과 유사하다고 가정하면, 예측값은 현재 처리되는 매크로블록 자체로부터의 화소값을 사용함으로써 결정된다. 추정 방법을 사용한 왜곡의 결정은, 현재 처리되는 매크로블록으로부터의 화소값이 다른 매크로블록으로부터의 화소값 대신에 사용되어 검색 시간을 감소시키기 때문에, 덜 시간 소모적이다. 추정 방법의 사용은 정확성을 덜 손실하면서 왜곡 값을 결정하는데 필요한 시간을 상당히 감소시킬 수 있다.

몇몇 실시예들에서, 추정 방법에 대한 의사 코드는 다음과 같다:

choose16×16mode()

{

step 1:

// DC 예측

pred= 현재 매크로블록의 좌측열과 최상부 행에서의 화소 평균

foreach 4×4 block

{

SAD_DC = sad(4×4 block, pred);

if(SAD_DC>T)

{

bail and goto step 2;

}

choose 16×16 DC mode and return

step 2:

// 수직 예측

foreach 4×4 block

{

SAD_V = 0;

foreach column in the 4×4 block

{

pred = 현재 매크로블록에서 이 열의 최상부 행에서의 화소값

SAD_V += sad(4×4 block column, pred);

}

SAD_V >>= 4;

if(SAD_V>T)

{

bail and goto step3;

}

choose 16×16 V and return

step 3:

// 수평 예측

foreach 4×4 block

{

SAD_H = 0;

foreach row in the 4×4 block

{

pred = 현재 매크로블록에서 이 행의 좌측 열에서의 화소값

SAD_H += sad(4×4 block row, pred);

}

SAD_H >>= 4;

if(SAD_H>T)

{

choose 16×16 planar and 4×4 modes and return

}

choose 16×16 H and return

}

특정 예측 모드의 왜곡이 계산되는 방식에 관계없이, 16×16 예측 모드 검색 알고리즘은 다음 연산을 수행한다:

1) 16×16 DC 예측 모드를 검사:

a) 16×16 DC 예측 모드에 의해 매크로블록의 각각의 4×4 블록에서 야기되는 왜곡을 결정.

b) 각 4×4 블록에서의 왜곡이 소정 임계치보다 적은 경우, 16×16 DC 예측 모드가 이 매크로블록에 대한 예측 모드로서 선택되고, 16×16 예측 모드 선택 알고리즘이 종료한다.

c) 임의의 4×4 블록에서의 왜곡이 소정 임계치보다 큰 경우, 16×16 예측 모드 검색 알고리즘은 단계 2로 진행한다.

2) 16×16 V 예측 모드를 검사:

a) 16×16 V 예측 모드에 의해 매크로블록의 각각의 4×4 블록에서 야기되는 왜곡을 결정.

b) 각 4×4 블록에서의 왜곡이 소정 임계치보다 적은 경우, 16×16 V 예측 모드가 이 매크로블록에 대한 예측 모드로서 선택되고, 16×16 예측 모드 선택 알고리즘이 종료한다.

c) 임의의 4×4 블록에서의 왜곡이 소정 임계치보다 큰 경우, 16×16 예측 모드 검색 알고리즘은 단계 3으로 진행한다.

3) 16×16 H 예측 모드를 검사:

a) 16×16 H 예측 모드에 의해 매크로블록의 각각의 4×4 블록에서 야기되는 왜곡을 결정.

b) 각 4×4 블록에서의 왜곡이 소정 임계치보다 적은 경우, 16×16 H 예측 모드가 이 매크로블록에 대한 예측 모드로서 선택되고, 16×16 예측 모드 선택 알고리즘이 종료한다.

c) 임의의 4×4 블록에서의 왜곡이 소정 임계치보다 큰 경우, 16×16 예측 모드 검색 알고리즘은 16×16 P 예측 모드와 4×4 인코딩 유형을 고려한다. 몇몇 실시예들에서, 두 개의 상술한 옵션 사이에서 선택은 (섹션 III에서 후술하는)4×4 예측 모드 검색 알고리즘의 사용에 의해 용이하게 된다. 다른 실시예들에서, 두 개의 상술한 옵션 사이에서 선택은 종래 방법을 사용하여(예를 들면, 16×16 P 예측 모드의 비용과 4×4 인코딩 유형을 사용함으로써 발생하는 최저 비용을 결정하고 최저 비용을 갖는 옵션을 선택함으로써) 행해진다.

도 3은 16×16 매크로블록의 화소의 예측 모드를 선택하기 위한 16×16 예측 모드 선택 방법(300)의 흐름도이다. 몇몇 실시예들에서, 방법(300)은 비디오 프레임을 인코딩하도록 구성된 소프트웨어 및/또는 하드웨어로 구현된다. 몇몇 실시예들에서, 인코딩 유형 선택 방법(300)은 도 1의 단계 120을 포함한다. 몇몇 실시예들에서, 16×16 예측 모드 검색 방법은 종래 방법 또는 (후술하는 바와 같이)특정 예측 모드에 의해 야기되는 매크로블록 내의 4×4 블록의 왜곡을 결정하는 개선된 방법을 사용한다.

이 방법(300)은 (305에서)16×16 DC 예측 모드에 의해 매크로블록의 16개의 4×4 블록 각각에서 야기된 왜곡을 결정함으로써 개시한다. 그 후, 이 방법은 (310에서)16×16 DC 예측 모드에 의해 야기된 모든 4×4 블록에서의 왜곡이 소정 임계치 왜곡보다 적은지를 판정한다. 그러한 경우, (315에서)16×16 DC 예측 모드가 매크로블록에 대한 예측 모드로서 선택되어 방법이 종료한다.

방법(300)이 16×16 DC 예측 모드에 의해 야기된 4×4 블록의 임의의 것에서 의 왜곡이 소정 임계치 왜곡보다 적지 않다고 판정하는 경우(310에서, 아니오), 이 방법은 (320에서) 16×16 V 예측 모드에 의해 매크로블록의 16개의 4×4 블록 각각에서 야기된 왜곡을 결정한다. 그 후, 이 방법은 (325에서)16×16 V 예측 모드에 의해 야기된 모든 4×4 블록에서의 왜곡이 소정 임계치 왜곡보다 적은지를 판정한다. 그러한 경우, (330에서)16×16 V 예측 모드는 매크로블록에 대한 예측 모드로서 선택되어 방법이 종료한다.

방법(300)이 16×16 V 예측 모드에 의해 야기된 4×4 블록의 임의의 것에서의 왜곡이 소정 임계치 왜곡보다 적지 않다고 판정하는 경우(325에서, 아니오), 이 방법은 (335에서) 16×16 H 예측 모드에 의해 매크로블록의 16개의 4×4 블록 각각에서 야기된 왜곡을 결정한다. 그 후, 이 방법은 (340에서)16×16 H 예측 모드에 의해 야기된 모든 4×4 블록에서의 왜곡이 소정 임계치 왜곡보다 적은지를 판정한다. 그러한 경우, (345에서)16×16 H 예측 모드는 매크로블록에 대한 예측 모드로서 선택되어 방법이 종료한다.

방법(300)이 16×16 H 예측 모드에 의해 야기된 4×4 블록의 임의의 것에서의 왜곡이 소정 임계치 왜곡보다 적지 않다고 판정하는 경우(340에서, 아니오), 이 방법은 (350에서) 매크로블록에 대한 예측 모드로서 16×16 P 예측 모드를 설정 또는 매크로블록에 대하여 4×4 인코딩 유형을 설정하는 것 사이에서 선택한다. 몇몇 실시예들에서, 두 개의 상술한 옵션 간의 선택은 (도 5를 참조하여 후술하는) 4×4 예측 모드 검색 방법(500)의 사용에 의해 용이하게 된다. 다른 실시예들에서, 두 개의 상술한 옵션의 선택은 (상술한 바와 같은) 종래 방법을 사용하여 행해진 다. 그 후, 이 방법은 종료한다.

섹션 III: 16×16 예측 모드 검색 알고리즘

일반 검색 알고리즘의 단계 1 후에, 4×4 인코딩 유형이 초기 고려에서 선택된 경우, 4×4 인코딩 유형 예측 모드가 매크로블록의 16개의 4×4 블록 각각에 대하여 선택된다. 본 섹션은 일반 검색 알고리즘의 단계 3을 설명한다. 몇몇 실시예들에서, 종래 방법은 (예를 들면, 9개의 예측 모드 각각의 비용을 결정하여 최저 비용을 갖는 모드를 선택함으로써)4×4 예측 모드를 선택하는데 사용된다. 다른 실시예들에서, 개선된 4×4 예측 모드 선택 알고리즘은 4×4 블록에 대한 4×4 예측 모드를 선택하는데 사용된다.

상술한 바와 같이, 비디오 스트림은 일련의 비디오 프레임으로 이루어지며, 여기서 각 프레임은 다수의 매크로블록으로 이루어진다. 매크로블록은 통상 (다른 크기의 매크로블록도 또한 가능하지만)16×16 어레이의 화소이며, (4×4 화소 어레이의 분할과 같은)분할로 나누어진다. H.264 코덱 표준하에서, 프레임을 내부 인코딩하는 경우, 4×4 어레이를 인코딩하는 9개의 서로 다른 방식이 있다(즉, 9개의 내부 4×4예측 모드가 있다). 9개의 모드는,

0. Intra_4×4_수직

1. Intra_4×4_수평

2. Intra_4×4_DC

3. Intra_4×4_대각_하향_좌측

4. Intra_4×4_대각_하향_우측

5. Intra_4×4_수직_우측

6. Intra_4×4_수평_하측

7. Intra_4×4_수직_좌측

8. Intra_4×4_수평_상측

각각의 4×4 어레이는 단지 하나의 예측 모드에서만 인코딩된다. 통상, 최저 비용이 되는 예측 모드는 선택될 수 있다. 비용은 통상 왜곡(여기서, 왜곡은 원형 화소값과 인코딩된 예측값 간의 차이를 반영) 또는 왜곡의 가중치 평균 및 예측 모드에 의해 생성된 비트수(여기서, 왜곡의 증가 및/또는 비트수는 비용을 증가시킨다)와 동일하다. 모든 9개 예측 모드 중에서 과도 검색이 최저 비용을 갖는 최적 예측 모드(선택 예측 모드)를 결정하도록 수행될 수 있다. 그러나, 통상, 모든 9개의 예측 모드 중에서 과도 검색 은 효율적이지 않다(훨씬 많은 시간과 처리 자원을 소비).

몇몇 실시예들에서, 화소 어레이에 대한 예측 모드를 결정하는 보다 효율적인 방법이 사용된다. 몇몇 실시예들에서, 화소 어레이에 대한 예측 모드를 결정할 때 감소된 개수의 모드 수를 고려하는 검색 알고리즘이 사용된다. 이 검색 알고리즘은 보다 효율적이며 상대적으로 정확성 손실이 적게 초래된다.

이 검색 알고리즘은 4×4 어레이의 9개의 가능한 예측 모드들 간의 논리/위치 관계에 기초한다. 도 4는 4×4 어레이의 9개의 예측 모드들 간의 논리/위치 관계를 나타내는 개념도를 나타낸다. 도 4에서 도시한 바와 같이, 예측 모드(2)가 원의 중심에 배치되고 이 원의 주변에 8개의 예측 모드(0, 1, 3, 4, 5, 6, 7 및 8) 가 배치되며, 여기서 예측 모드는 노드로 표현된다. 두 개의 예측 모드가 서로 원 상에서 근접해짐에 따라, 두 예측 노드 간의 논리/위치 관계가 강해진다. 유사하게, 두 개의 예측 모드가 원 상에서 서로 멀어지면, 두 예측 모드 간의 논리/위치 관계가 약해진다. 예를 들면, 예측 모드 0과 5는 원 상에서 서로 인접하기 때문에, 이는 이 두 예측 모드들 간에는 강한 논리/위치 관계가 있음을 나타낸다. 또다른 예로서, 예측 모드 0과 1은 원 상에서 대향 점이기 때문에, 이는 이 두 예측 모드들 간에는 약한 논리/위치 관계가 있음을 나타낸다. 예측 모드 2는 원의 중심에 있어 다른 예측 어느 것과도 논리/위치 관계가 없음을 나타낸다.

도 4의 개념도는 내부 인코딩 4×4 어레이에 대한 H.264 코덱 표준에 기초한다. 현재 처리되는 4×4 어레이에 있어서, H.264 표준하에서의 예측 모드는, 현재 처리되는 어레이에 대하여 인코딩된 예측 정보의 기초가 될 다른 4×4 어레이(여기서, 예측 어레이라고 함)의 (현재 처리되는 4×4 어레이에 대한)위치를 나타낸다. 예를 들면, 예측 모드 0(수직)은 현재 처리되는 어레이에 대한 예측 어레이는 현재 처리되는 어레이의 상부에 위치함을 의미하고, 예측 모드 1(수평)은 현재 예측되는 어레이에 대한 예측 어레이는 현재 처리되는 어레이의 좌측에 위치함을 의미한다.

이와 같이, 예측 모드들 간의 논리/위치 관계의 강약이 (현재 처리되는 4×4 어레이에 대한 예측 모드로 나타내는 위치 관계에 기초하는)접근될 수 있다. 예를 들면, 현재 처리되는 어레이 상부의 예측 어레이(예측 모드 0으로 표시)는 현재 처리되는 어레이 좌측에 위치한 예측 어레이(예측 모드 1로 표시)에 대하여 약한 논리/위치 관계를 갖기 때문에, 예측 모드 0은 예측 1에 대하여 약한 논리/위치 관계 를 갖는다. 이러한 약한 논리/위치 관계는 도 4에 반영되어, 예측 모드 0과 1이 원의 대향 부분에 있게 된다. 반면에, 현재 처리되는 어레이 상부에 위치한 예측 어레이(예측 모드 0으로 표시)는 현재 처리되는 어레이의 우측 상부에 위치하는 예측 어레이(예측 모드 5로 표시)에 대하여 강한 논리/위치 관계를 갖기 때문에, 예측 모드 0은 예측 모드 5에 대하여 강한 논리/위치 관계를 갖는다. 이러한 강한 논리/위치 관계는 도 4에서 반영되어, 예측 모드 0과 5가 원 상에서 인접하게 된다.

원 주변에 배치된 8개의 예측 모드(0, 1, 3, 4, 5, 6, 7 및 8)는 4그룹의 논리/위치 관련 예측 모드로 나누어질 수 있다.

1. 7, 0, 및 5 (수직_좌측, 수직, 및 수직_우측)

2. 8, 1, 및 6 (수평_상측, 수평, 및 수평_하측)

3. 7, 3, 및 8 (수직_좌측, 대각_하향_좌측, 및 수평_상측)

4. 5, 4, 및 6 (수직_우측, 대각_하향_우측, 및 수평_하측)

동일 그룹 내의 예측 모드는 서로 강한 논리/위치 관계를 갖는다. 몇몇 실시예들에서, 검색 알고리즘은 예측 모드 2의 비용과 함께 각 그룹에서의 하나의 예측 모드의 비용을 결정한다. 그 후, 검색 알고리즘은 일련의 예측 모드 중에서 최저 비용을 갖는 예측 모드를 결정한다. 최저 비용을 갖는 예측 모드가 예측 모드의 특정 그룹인 경우, 모든 9개의 가능한 예측 모드 중 최저 비용이 이 특정 그룹 내에 있을 확률이 높다. 이와 같이, 그 후, 검색 알고리즘은 이 특정 그룹에서 최저 비용을 갖는 예측 모드를 결정하고, 최저 비용을 갖는 예측 모드는 어레이에서 최적 예측 모드로서 선택된다.

예를 들면, 몇몇 실시예들에서, 검색 알고리즘은 예측 모드 0, 1, 2, 3, 및 4의 비용을 결정하며, 여기서 예측 모드 0, 1, 3, 및 4는 서로 다른 그룹으로부터의 것이다. 예측 모드 0, 1, 3, 또는 4가 일련의 예측 모드(0, 1, 2, 3 및 4) 중에서 최저 비용을 갖는 경우, 검색 알고리즘은 이전에 결정된 예측 모드가 포함되는 예측 모드의 그룹 중에서 최저 비용을 결정한다. 예를 들면, 검색 알고리즘이 예측 모드 1가 일련의 예측 모드(0, 1, 2, 3, 및 4) 중에서 최저 비용을 갖는다고 판정한 경우에는, 검색 알고리즘은 예측 모드(8, 1, 및 6)의 그룹 중에서 최저 비용을 결정하고, 최저 비용을 갖는 예측 모드는 최적 예측 모드로서 선택된다.

몇몇 실시예들에서, 검색 알고리즘은 9개의 가능한 예측 모드 중에서 전부가 아닌 일부를 포함하는 소정 집합의 예측 모드를 처음에 고려하여 이들을 비교한다. 몇몇 실시예들에서, 소정 집합의 예측 모드는 (도 4를 참조하여 상술한) 4개의 예측 모드 그룹 각각으로부터 하나의 예측 모드를 포함한다. 후술하는 실시예들에서, 소정 집합의 예측 모드는 예측 모드 0, 1, 2, 3, 및 4를 포함한다. 그러나, 다른 실시예들에서, 소정 집합의 예측 모드는 다른 예측 모드를 포함한다.

검색 알고리즘은 집합 내의 각 예측 모드에 대한 비용을 결정하며, 여기서 C0, C1, C2, C3 및 C4는 각각 예측 모드 0, 1, 2, 3, 및 4에 대하여 결정된 비용이다. 각 예측 모드에 대한 비용은 공지된 방법을 사용하여 결정될 수 있다. 그 후, 검색 알고리즘은 최저 비용을 갖는 예측 모드의 인덱스 번호(0, 1, 2, 3, 또는 4)를 결정하며, 여기서 변수 n은 결정된 인덱스 번호를 나타내는데 사용된다. 이 연산은 다음 식으로 표현될 수 있다:

n = GetInlOfMinCost(0, 1, 2, 3, 4)

여기서, GetInlOfMinCost는 일련의 예측 모드(예를 들면, 0, 1, 2, 3, 및 4)에서 각 예측 모드에 대한 비용을 결정하고 이 집합에서 예측 모드의 인덱스 번호가 최저 비용을 갖는다고 결정하는 함수이다.

그 후, 검색 알고리즘은 다음 연산을 수행한다:

If n == 2

x = 2

Else If n == 0

x == GetInlOfMinCost(7, 0, 5)

Else If n == 1

x == GetInlOfMinCost(8, 1, 6)

Else If n == 3

x == GetInlOfMinCost(7, 3, 8)

Else If n == 4

x == GetInlOfMinCost(5, 4, 6)

여기서, x는 화소 어레이에 대한 최적 예측 모드(선택 예측 모드)로서 궁극적으로 선택되는 예측 모드의 인덱스 번호이다.

이와 같이, 검색 알고리즘은 n이 2인지를 판정한다. 그러한 경우, 선택 예측 모드는 예측 모드 2이다. n이 2가 아닌 경우에는, 검색 알고리즘은 n이 0인지 를 판정한다. 그러한 경우, 선택된 예측 모드가 일련의 예측 모드(7, 0, 5) 중 최저 비용을 갖는 예측 모드이다. n이 0이 아닌 경우, 검색 엔진은 n인 1인지를 판정한다. 그러한 경우, 선택 예측 모드는 일련의 예측 모드(8, 1, 6) 중 최저 비용을 갖는 예측 모드이다. n이 1이 아닌 경우, 검색 엔진은 n인 3인지를 판정한다. 그러한 경우, 선택 예측 모드는 일련의 예측 모드(7, 3, 8) 중 최저 비용을 갖는 예측 모드이다. n이 3이 아닌 경우, 검색 엔진은 n인 4인지를 판정한다. 그러한 경우, 선택 예측 모드는 일련의 예측 모드(5, 4, 6) 중 최저 비용을 갖는 예측 모드이다.

도 5는 4×4 어레이의 매크로블록에 대한 예측 모드를 선택하는 4×4 예측 모드 검색 방법(500)의 흐름도이다. 몇몇 실시예들에서, 방법(500)은 비디오 프레임을 인코딩하도록 구성된 소프트웨어 및/또는 하드웨어로 구현된다. 몇몇 실시예들에서, 4×4 예측 모드 검색 방법(500)은 도 1의 단계 115를 포함한다.

방법(500)은 (505에서)매크로블록을 16개의 4×4 어레이로 분할함으로써 개시한다. 그 후, 이 방법은 (510에서)처리를 위해 현재의 4×4 어레이로서 제1 4×4 어레이를 설정한다. 현재의 4×4 어레이에 있어서, 방법(500)은 그 후 (515에서)예측 모드 0, 1, 2, 3 및 4 각각에 대한 비용을 결정한다. 이 방법은 (520에서)최저 비용을 갖는 예측 모드가 2인지를 판정한다. 그러한 경우, 이 방법은 (525에서)현재의 4×4 어레이에 대한 예측 모드로서 예측 모드 2를 설정한다. 그 후, 이 방법은 (585에서)처리될 매크로블록 내에 보다 많은 4×4 어레이가 있는지를 판정한다. 그러한 경우, 이 방법은 (590에서)현재의 4×4 어레이로서 다음 4× 4 어레이를 설정하고, 단계 515로 진행한다. 그렇지 않은 경우에는, 방법이 종료한다.

이 방법이 최저 비용을 갖는 예측 모드가 2가 아니라고 판정한 경우에는(단계 520에서, 아니오), 이 방법은 (530에서)최저 비용을 갖는 예측 모드가 0인지를 판정한다. 그러한 경우, 이 방법은 (535에서)예측 모드 7, 0 및 5 각각에 대한 비용을 결정한다. 그 후, 이 방법은 (540에서)현재의 4×4 어레이에 대한 예측 모드로서 (예측 모드 7, 0, 및 5 중에서)최저 비용을 갖는 예측 모드를 설정한다. 그 후, 이 방법은 단계 585로 진행한다.

이 방법이 최저 비용을 갖는 예측 모드가 0이 아니라고 판정한 경우에는(단계 530에서, 아니오), 이 방법은 (545에서)최저 비용을 갖는 예측 모드가 1인지를 판정한다. 그러한 경우, 이 방법은 (550에서)예측 모드 8, 1 및 6 각각에 대한 비용을 결정한다. 그 후, 이 방법은 (555에서)현재의 4×4 어레이에 대한 예측 모드로서 (예측 모드 8, 1, 및 6 중에서)최저 비용을 갖는 예측 모드를 설정한다. 그 후, 이 방법은 단계 585로 진행한다.

이 방법이 최저 비용을 갖는 예측 모드가 1이 아니라고 판정한 경우에는(단계 545에서, 아니오), 이 방법은 (560에서)최저 비용을 갖는 예측 모드가 3인지를 판정한다. 그러한 경우, 이 방법은 (565에서)예측 모드 7, 3 및 8 각각에 대한 비용을 결정한다. 그 후, 이 방법은 (570에서)현재의 4×4 어레이에 대한 예측 모드로서 (예측 모드 7, 3, 및 8 중에서)최저 비용을 갖는 예측 모드를 설정한다. 그 후, 이 방법은 단계 585로 진행한다.

이 방법이 최저 비용을 갖는 예측 모드가 3이 아니라고 판정한 경우에는(단계 560에서, 아니오), 이는 최저 비용을 갖는 예측 모드가 4임을 의미한다. 그 후, 이 방법은 (575에서)예측 모드 5, 4, 및 6 각각에 대한 비용을 결정한다. 이 방법은 (580에서)현재의 4×4 어레이에 대한 예측 모드로서 (예측 모드 5, 4, 및 6 중에서)최저 비용을 갖는 예측 모드를 설정한다. 그 후, 이 방법은 단계 585로 진행한다.

몇몇 실시예들에서, 이 방법(500)은 4×4 어레이의 매크로블록에 대한 예측 모드를 설정하고, 여기서, 각 4×4 어레이에 대한 예측 모드 선택은 매크로블록 내의 하나 이상의 다른 4×4 어레이에 대하여 이전의 예측 모드 선택에 의존한다. 이들 실시예들에서, 매크로블록의 4×4 어레이 각각에 대한 예측 모드 선택은 이의 상부 및 좌측 주변 4×4 어레이에 대한 인코딩 값(이에 따라 선택된 예측 모드)에 의존한다. 따라서, 이들 실시예들에서, 방법(500)은 매크로블록에서 상부 좌측 4×4 어레이로부터 개시하는 예측 모드를 선택하고, 우측 하향으로 진행한다. 상부 좌측 주변 4×4 어레이에 대하여 이전에 선택된 예측 모드가 주어지면, 방법(500)은 그 후 현재 처리되는 4×4 어레이에 대한 최저 비용을 갖는 예측 모드(9개의 예측 모드 중에서)를 선택한다. 이를 위해서, 방법(500)은 결과적인 조합의 전체 비용을 계산할 수 있다(즉, 16개의 결정된 비용의 합산 비용).

A. 다른 예측 모드 검색 알고리즘

다른 실시예들에서, 다른 예측 모드 검색 알고리즘이 다른 연산 집합을 수행한다. 초기에는, 다른 검색 알고리즘은 일련의 예측 모드(0, 1, 3, 및 4) 중에서 최저 비용을 갖는 예측 모드의 인덱스 번호를 결정하며, 여기서 변수 a는 결정된 인덱스 번호를 나타내는데 사용된다. 다른 검색 알고리즘은 또한 일련의 예측 모드(0, 1, 3, 및 4) 중에서 2번째의 최저 비용을 갖는 예측 모드의 인덱스 번호를 결정하며, 여기서, 변수 b는 결정된 인덱스 번호를 나타내는데 사용된다. 또한, 다른 검색 알고리즘은 또한 일련의 예측 모드(0, 1, 2, 3, 및 4) 중에서 최저 비용을 갖는 예측 모드의 인덱스 번호를 결정하며, 여기서, 변수 n은 결정된 인덱스 번호를 나타내는데 사용된다.

이들 연산은 다음 식으로 표현될 수 있다.

a = GetInlOfMinCost_a(0, 1, 3, 4)

b = GetInlOfSecondMinCost_b(0, 1, 3, 4)

n = GetInlOfMinCost(0, 1, 2, 3, 4)

여기서, GetInlOfSecondMinCost_b는 일련의 예측 모드(예를 들면, 0, 1, 3, 및 4)에서 각 예측 모드에 대한 비용을 결정하는 함수로서, 2번째 최저 비용을 갖는 집합 내의 예측 모드의 인덱스 번호를 결정한다.

검색 알고리즘은 그 후 다음 연산을 수행한다.

If n == 2

x = 2

Else If(a, b) == (0, 4) or (4, 0)

x == GetInlOfMinCost(0, 5, 4)

Else If(a, b) == (4, 1) or (1, 4)

x == GetInlOfMinCost(4, 6, 1)

Else If(a, b) == (1, 3) or (3, 1)

x == GetInlOfMinCost(1, 8, 3)

Else If(a, b) == (3, 0) or (0, 3)

x == GetInlOfMinCost(3, 7, 0)

Else

x = n

이와 같이, 다른 검색 알고리즘은 n이 2인지를 판정한다. 그러한 경우, 선택 예측 모드는 예측 모드 2이다. n이 2가 아닌 경우, 다른 검색 알고리즘은 그 후 a가 0이고 b가 4인지 또는 그 역인지(즉, a가 4이고 b가 0인 경우)를 결정한다. 그러한 경우, 선택 예측 모드는 일련의 예측 모드(0, 5, 4)의 최저 비용을 갖는 예측 모드이다.

a가 0이고 b가 4이거나 그 역의 경우가 참이 아닌 경우에는, 다른 검색 알고리즘은 a가 4이고 b가 1인지 또는 그 역인지를 판정한다. 그러한 경우, 선택 예측 모드는 일련의 예측 모드(4, 6, 1) 중에서 최저 비용을 갖는 예측 모드이다.

a가 4이고 b가 1이거나 그 역의 경우가 참이 아닌 경우에는, 다른 검색 알고리즘은 a가 1이고 b가 3인지 또는 그 역인지를 판정한다. 그러한 경우, 선택 예측 모드는 일련의 예측 모드(1, 8, 3) 중에서 최저 비용을 갖는 예측 모드이다.

a가 1이고 b가 3이거나 그 역의 경우가 참이 아닌 경우에는, 다른 검색 알고리즘은 a가 3이고 b가 0인지 또는 그 역인지를 판정한다. 그러한 경우, 선택 예측 모드는 일련의 예측 모드(3, 7, 0) 중에서 최저 비용을 갖는 예측 모드이다.

도 6은 4×4 어레이의 매크로블록에 대한 예측 모드를 선택하는 다른 4×4 예측 모드 검색 방법(600)의 흐름도이다. 몇몇 실시예들에서, 4×4 다른 예측 모드 검색 방법(600)은 도 1의 단계 115를 포함한다.

방법(600)은 (605에서)매크로블록을 16개의 4×4 어레이로 분할함으로써 개시한다. 그 후, 이 방법은 (610에서)처리를 위해 현재 4×4 어레이로서 제1 4×4 어레이를 설정한다. 현재의 4×4 어레이에 있어서, 이 방법(600)은 그 후 (615에서)예측 모드(0, 1, 2, 3, 및 4) 각각에 대한 비용을 결정한다. 이 방법은 (616에서) 예측 모드 0, 1, 3, 및 4 중에서 최저 비용을 갖는 예측 모드의 예측 모드 인덱스와 동일하도록 변수 a를 설정한다. 이 방법은 (617에서)예측 모드 0, 1, 3, 및 4 중에서 2번째 최저비용을 갖는 예측 모드의 예측 인덱스와 동일하도록 변수 b를 설정한다. 또한, 이 방법은 (618에서)예측 모드 0, 1, 2, 3, 및 4 중에서 최저 비용을 갖는 예측 모드의 예측 모드 인덱스와 동일하도록 변수 n을 설정한다.

방법은 (620에서)n이 2인지를 판정한다. 그러한 경우, 이 방법은 (625에서)현재의 4×4 어레이에 대한 예측 모드로서 예측 모드 2를 설정한다. 그 후, 이 방법은 (685에서)처리될 매크로블록 내에 보다 많은 4×4 어레이가 있는지를 판정한다. 그러한 경우, 이 방법은 (690에서)현재의 4×4 어레이로서 다음 4×4 어레이를 설정하며, 단계 615로 진행한다. 그렇지 않은 경우, 이 방법은 종료한다.

이 방법은 n이 2가 아니라고 판정한 경우(단계 620에서, 아니오), 이 방법은 (630에서) 이 조건(a가 0이고 b가 4이거나 또는 그 역의 경우)이 참인지를 판정한다. 그러한 경우, 이 방법 (635에서)예측 모드 0, 5, 및 4의 각각에 대한 비용을 결정한다. 그 후, 이 방법은 (640에서)현재의 4×4 어레이에 대한 예측 모드로서 (예측 모드 0, 5, 및 4 중에서)최저 비용을 갖는 예측 모드를 설정한다.

이 방법이 조건(a가 0이고 b가 4이거나 그 역인 경우)이 참이 아니라고 판정하는 경우(630에서, 아니오), 이 방법은 (645에서)조건(a가 4이고 b가 1이거나 그 역인 경우)이 참인지를 판정한다. 그러한 경우, 이 방법은 (650에서)그 후 예측 모드 4, 6, 및 1의 각각에 대한 비용을 결정한다. 그 후, 이 방법은 (655에서)현재의 4×4 어레이에 대한 예측 모드로서 (예측 모드 4, 6, 및 1 중에서)최저 비용을 갖는 예측 모드를 설정한다. 그 후, 이 방법은 685로 진행한다.

이 방법이 조건(a가 4이고 b가 1이거나 그 역인 경우)이 참이 아니라고 판정하는 경우(645에서, 아니오), 이 방법은 (660에서)조건(a가 1이고 b가 3이거나 그 역인 경우)이 참인지를 판정한다. 그러한 경우, 이 방법은 (665에서)그 후 예측 모드 1, 8, 및 3의 각각에 대한 비용을 결정한다. 그 후, 이 방법은 (670에서)현재의 4×4 어레이에 대한 예측 모드로서 (예측 모드 1, 8, 및 3 중에서)최저 비용을 갖는 예측 모드를 설정한다. 그 후, 이 방법은 685로 진행한다.

이 방법이 조건(a가 1이고 b가 3이거나 그 역인 경우)이 참이 아니라고 판정하는 경우(660에서, 아니오), 이 방법은 (672에서)조건(a가 3이고 b가 0이거나 그 역인 경우)이 참인지를 판정한다. 그러한 경우, 이 방법은 (675에서)그 후 예측 모드 3, 7, 및 0의 각각에 대한 비용을 결정한다. 그 후, 이 방법은 (680에서)현재의 4×4 어레이에 대한 예측 모드로서 (예측 모드 3, 7, 및 0 중에서)최저 비용을 갖는 예측 모드를 설정한다. 그 후, 이 방법은 685로 진행한다. 이 방법이 조건(a가 3이고 b가 0이거나 그 역인 경우)이 참이 아니라고 판정하는 경우(672에서, 아니오), (673에서)이 방법은 (단계 618에서 결정되는)변수 n으로 표시된 예측 모드와 동일한 예측 모드, 즉, 예측 모드 0, 1, 2, 3, 및 4 중에서 최저 비용을 갖는 예측 모드를 설정한다. 그 후, 이 방법은 685로 진행한다.

도 7은 몇몇 실시예들이 구현되는 컴퓨터 시스템(700)을 제시한다. 이 컴퓨터 시스템(700)은 버스(705), 프로세서(710), 시스템 메모리(715), 판독 전용 메모리(720), 영구 저장 장치(725), 입력 장치(730), 및 출력 장치(735)를 포함한다.

버스(705)는 컴퓨터 시스템(700)의 수많은 내부 장치를 통신가능하게 접속하는 모든 시스템, 주변, 및 칩셋 버스를 총괄하여 나타낸다. 예를 들면, 버스(705)는 판독 전용 메모리(720), 시스템 메모리(715), 및 영구 저장 장치(725)와 프로세스(710)를 통신가능하게 접속한다.

판독 전용 메모리(ROM; 720)는 프로세서(710)와 컴퓨터 시스템의 다른 모듈에 의해 요구되는 정적 데이터와 명령어를 저장한다. 반면에, 영구 저장 장치(725)는 판독 및 기입 메모리 장치이다. 이 장치는 컴퓨터 시스템(700)이 오프인 경우에도 명령어와 데이터를 저장하는 비휘발성 메모리 유닛이다. 몇몇 실시예들은 영구 저장 장치(725)로서 (자기 또는 광 디스크 및 이의 대응하는 디스크 드라이브와 같은)대용량 저장 장치를 사용한다. 다른 실시예들은 영구 스토리지 장치 로서 (플로피 디스크 또는 zip

디스크, 및 이의 대응하는 디스크 드라이브와 같은)분리형 스토리지 장치를 사용한다.

영구 저장 장치(725)와 같이, 시스템 메모리(715)는 판독 및 기입 메모리 장치이다. 그러나, 저장 장치(725)와는 달리, 시스템 메모리는 랜덤 액세스 메모리(RAM)와 같은 휘발성 판독 및 기입 메모리이다. 이 시스템 메모리는 런타임 시에 프로세스가 요구하는 일부 명령어 및 데이터를 저장한다.

몇몇 실시예들을 수행하는데 필요한 명령어 및/또는 데이터는 시스템 메모리(715), 영구 저장 장치(725), 판독 전용 메모리(720), 또는 이 셋의 임의의 조합에 저장된다. 예를 들면, 다양한 메모리 유닛이 몇몇 실시예들에 따라 비디오 데이터 스트림을 인코딩 또는 디코딩하는 명령어를 포함하거나 및/또는 비디오 데이터를 포함할 수 있다. 이들 다양한 메모리 유닛으로부터, 프로세서(710)는 몇몇 실시예들의 프로세스를 실행하기 위해서 실행할 명령어와 처리할 데이터를 검색한다. 이들 다양한 메모리 유닛으로부터, 프로세서(710)는 몇몇 실시예들의 프로세스를 실행하기 위해서 실행할 명령어와 처리할 데이터를 검색한다.

버스(705)는 또한 입력 및 출력 장치(730 및 735)에 접속한다. 입력 장치(730)는 사용자가 정보를 전달하고 컴퓨터 시스템(700)에 대한 명령어를 선택할 수 있게 한다. 입력 장치(730)는 영숫자 키보드와 커서 제어기를 포함한다. 출력 장치(735)는 출력 시스템(700)에 의해 생성되는 이미지를 디스플레이한다. 출력 장치는 음극선관(CRT), 또는 액정 디스플레이(LCD)와 같은 프린터와 디스플레이 장치를 포함한다.

마지막으로, 도 7에 도시한 바와 같이, 버스(705)는 또한 컴퓨터 시스템(700)을, 예를 들면, 네트워크 어댑터(미도시)를 통해 네트워크(765)에 연결한다. 이러한 방식으로, 컴퓨터 시스템(700)은 (근거리 네트워크("LAN"), 광역 네트워크("WAN"), 또는 인트라넷과 같은) 컴퓨터 네트워크의 일부이거나 (인터넷과 같은)네트워크의 네트워크일 수 있다. 컴퓨터 시스템(700)의 임의의 또는 모든 컴포넌트는 몇몇 실시예들에서 사용될 수 있다. 그러나, 당업자는 임의의 다른 구성이 다른 실시예들에서 사용될 수 있음을 이해할 것이다.

본 발명은 수많은 특정 세부사항을 참조하여 설명하였지만, 당업자는 본 발명이 본 발명의 취지를 벗어나지 않으면서 다른 특정 형태로 구체화될 수 있음을 인식할 것이다. 예를 들면, 본 발명의 다수의 실시예들은 매크로블록을 참조하여 설명하였다. 당업자는 이들 실시예들은 임의의 다른 화소값 어레이와 함께 사용될 수 있음을 인식할 것이다.

상술한 본 발명에 따르면, 비디오 프레임의 매크로블록에 있어서의 인코딩 유형과 예측 모드를 보다 효율적으로 결정할 수 있다.

Claims

복수의 서브블록을 포함하는 비디오 화면의 화소값들의 블록을 내부 인코딩하기 위한 분할 사이즈(partition size)를 식별하기 위한 방법으로서,

상기 블록에 대해 복수의 분산 값을 계산하는 단계 - 각각의 분산 값은 상기 블록의 서브블록의 화소 값들의 분산에 기초함 -;

상기 분산 값 모두가 소정 임계 분산을 만족하는 때, 각 서브블록보다 큰 분할 사이즈를 특정하는 블록에 대한 제1 인코딩 유형을 선택하는 단계; 및

상기 분산 값 중 적어도 하나가 상기 소정 임계 분산을 만족하지 않는 때, 각 서브블록보다 작은 분할 사이즈를 특정하는 블록에 대한 제2 인코딩 유형을 선택하는 단계

를 포함하는, 분할 사이즈 식별 방법.
제1항에 있어서,

상기 서브블록 각각은 8×8 화소 값을 포함하고,

상기 제1 인코딩 유형은 16×16 화소 값을 포함하는 분할 사이즈를 특정하고,

상기 제2 인코딩 유형은 4×4 화소 값을 포함하는 분할 사이즈를 특정하는, 분할 사이즈 식별 방법.
제1항에 있어서,

상기 소정 임계치 분산은 상기 비디오 화면 내의 모든 서브블록들의 평균 분산과 동일한, 분할 사이즈 식별 방법.
제1항에 있어서,

양자화 매개변수 값이 증가함에 따라 상기 소정 임계치 분산이 증가하도록, 상기 양자화 매개변수 값에 의존하는 인자에 의해 상기 소정 임계치 분산이 스케일링되는, 분할 사이즈 식별 방법.
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
비디오 화면을 위한 화소들의 블록을 인코딩하기 위한 방법으로서, 상기 화소들의 블록은 복수의 화소들의 서브블록을 포함하고, 상기 방법은

예측 모드를 사용하여, 상기 블록의 각 서브블록에 대하여, 상기 서브블록의 원형 화소 값들 및 상기 블록의 경계 화소들 집합으로부터 유도되는 상기 서브블록의 예측된 값들의 집합 간의 차이에 기초하는 왜곡 값을 계산하는 단계; 및

상기 블록의 모든 서브블록에 대해 상기 계산된 왜곡 값이 소정 임계 왜곡값을 만족하는 때, 상기 예측 모드를 사용하여 상기 화소들의 블록을 인코딩하는 단계

를 포함하는 인코딩하는 방법.
삭제
삭제
삭제
삭제
삭제
제15항에 있어서,

상기 예측 모드는 제1 예측 모드이고, 상기 왜곡 값은 제1 왜곡 값이고, 상기 예측 값들의 집합은 제1 예측 값들의 집합이며, 상기 방법은,

상기 제1 왜곡 값 모두가 상기 소정 임계 왜곡 값을 만족하지 않는다고 결정하면, 제2 예측 모드를 사용하여 상기 블록의 각 서브블록에 대한 제2 왜곡 값을 계산하는 단계; 및

상기 블록의 모든 서브블록에 대해 상기 제2 왜곡 값이 상기 소정 임계 왜곡 값을 만족하는 때, 상기 제2 예측 모드를 사용하여 상기 블록을 인코딩하는 단계

를 더 포함하는, 인코딩하는 방법.
제21항에 있어서,

상기 제2 왜곡 값 모두가 상기 소정 임계 왜곡 값을 만족하지 않는다고 결정하면, 제3 예측 모드를 사용하여 상기 블록을 인코딩하는 단계를 더 포함하는, 인코딩하는 방법.
제22항에 있어서,

상기 제3 예측 모드는, 상기 제2 예측 모드에 의해 특정되는 분할 사이즈보다 작은 블록의 분할 사이즈를 특정하는, 인코딩하는 방법.
제15항에 있어서,

상기 경계 화소의 집합은 상기 서브블록에 수직 또는 수평으로 정렬된 블록의 경계상의 화소를 포함하는 인코딩하는 방법.
제15항에 있어서,

상기 예측 모드를 사용하여 상기 블록의 각 서브블록에 대하여 왜곡 값을 계산하는 단계는,

상기 예측 모드에 기초하여 상기 블록의 경계 화소들 집합을 식별하는 단계;

상기 식별된 블록의 경계 화소들 집합을 사용하여 상기 서브 블록에 대한 상기 예측된 값들의 집합을 유도하는 단계; 및

상기 서브블록의 상기 원형 화소 값들 및 상기 서브블록에 대한 상기 유도된 예측된 값들의 집합 간의 차이에 기초하여 상기 왜곡 값을 계산하는 단계

를 포함하는, 인코딩하는 방법.
제25항에 있어서,

상기 예측 모드에 의해 식별된 상기 경계 화소들 집합은 상기 블록의 가장 좌측열(left most column)의 화소를 포함하는 인코딩하는 방법.
제25항에 있어서,

상기 예측 모드에 의해 식별된 상기 경계 화소들 집합은 상기 블록의 가장 상부 행(top most row)의 화소를 포함하는 인코딩하는 방법.
제25항에 있어서,

상기 예측된 값은 상기 예측 모드에 의해 식별된 상기 경계 화소들 집합의 평균 값으로부터 유도되는 인코딩하는 방법.
제15항에 있어서,

상기 화소 블록은 16×16 화소들을 포함하고, 상기 블록의 각 서브블록은 4×4 화소를 포함하는 인코딩하는 방법.
제1항에 있어서,

상기 선택된 인코딩 유형에 기초하여 예측 인코딩 모드를 선택하는 단계를 더 포함하는 분할 사이즈 식별 방법.
제30항에 있어서,

상기 선택된 인코딩 유형이 4×4 화소 값들을 포함하는 상기 블록의 분할을 특정하는 때, 상기 예측 인코딩 모드는 복수의 4×4 내부 예측 인코딩 모드 중 하나인 분할 사이즈 식별 방법.
제30항에 있어서,

상기 선택된 인코딩 유형이 16×16 화소 값들을 포함하는 상기 블록의 분할을 특정하는 때, 상기 예측 인코딩 모드는 복수의 16×16 내부 예측 인코딩 모드 중 하나인 분할 사이즈 식별 방법.
제30항에 있어서,

상기 예측 인코딩 모드를 선택하는 단계는 (i) 상기 블록을 인코딩하기 위해 특정 예측 인코딩 모드를 사용함으로써 발생하는 상기 블록의 서브블록의 왜곡을 계산하는 단계, 및 (ii) 상기 서브블록에 대해 상기 계산된 왜곡이 소정 임계치 아래인지 여부를 결정하는 단계를 더 포함하는, 분할 사이즈 식별 방법.
제1항 내지 제4항, 제15항 및 제21항 내지 제33항 중 어느 한 항에 따른 단계들을 구현하기 위한 명령어들 집합을 포함하는, 적어도 하나의 프로세서에 의해 실행가능한 컴퓨터 프로그램을 저장하는 컴퓨터 판독 가능 매체.
컴퓨터 시스템으로서,

제1항 내지 제4항, 제15항 및 제21항 내지 제33항 중 어느 한 항에 따른 단계들을 구현하기 위한 명령어들을 저장하는 메모리; 및

상기 메모리에 저장된 상기 명령어들을 검색하고 실행하기 위한 처리 유닛을 포함하는 컴퓨터 시스템.
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제