KR20040036923A

KR20040036923A - 변환 및 연속되는 양자화의 구현

Info

Publication number: KR20040036923A
Application number: KR10-2004-7002972A
Authority: KR
Inventors: 할라푸로안티; 시멜리우스킴
Original assignee: 노키아 코포레이션
Priority date: 2001-08-30
Filing date: 2002-08-27
Publication date: 2004-05-03
Also published as: WO2003019787A2; CN100392982C; JP4444940B2; DE60227688C5; US20100195923A1; EP1440515B1; MXPA04001724A; US20030078953A1; AU2002328100A1; HU228603B1; WO2003019787A3; ZA200401224B; JP2007129731A; EP1914894B1; US10515134B2; EP1914894A3; DE60227688D1; US7082450B2; HK1122622A1; CN101261619B

Abstract

본 발명은 디지털 데이터의 압축을 위해 디지털 데이터에 연속해서 적용될 DCT 근사화 및 양자화에 관한 것이다. 변환을 개선하기 위해, 디지털 데이터에 적용될 때 연산식을 덜 필요로 하는 소정 변환 매트릭스를 단순화하도록 제안된다. 또, 무리수들로 이뤄진 단순화된 변환 매트릭스의 성분들을 유리수로 근사화시킨다. 유리수에 의해 단순화된 변환 매트릭스 성분들의 근사화를 보상하기 위해 소정 양자화를 확장한다. 단순화된 변환 매트릭스와 확장된 양자화가 발명의 구현을 위한 기초적인 것으로서 사용되고, 양호한 품질의 고속 변환이 이뤄지게 된다. 압축된 디지털 데이터의 압축해제시 사용되는 IDCT의 근사화는 그에 상응하여 단순화될 수 있다.

Description

변환 및 연속되는 양자화의 구현{Implementation of a transform and of a subsequent quantization}

디지털 데이터의 효율적 전송 등을 가능하게 하도록, 종래 기술로부터 디지털 데이터를 압축하기 위한 DCT 및 양자화 시퀀스의 이용이 알려져 있다. 특히 디지털 이미지 데이터의 압축은 일반적으로 DCT 및, DCT에 의해 얻어진 DCT 계수들에 대한 연속된 양자화를 이용해 이뤄질 수 있다.

1 차원 디지털 데이터에 대한 DCT에서, 소정 개수로 된 소스 값들의 각 시퀀스가 변환 계수들로 변환된다. 비디오 코딩에 있어서, 그 소스 값들은 픽셀 값들또는 예측 에러값들 등이 될 수 있다. 결과적인 변환 계수들 각각은 소스 데이터에 존재하는 어떤 주파수 범위를 나타낸다. 값의 계수로의 DCT는 다음과 같이 정의된다:

이 식에서, N은 한 시퀀스의 소스 값들에 들어 있는 소스 값들의 소정 개수이다.

압축을 위해, 이미지 데이터는 보통 2차원 디지털 데이터로 된 블록들 안에 주어진다. 그러한 데이터 DCT가 다음의 식과 같이 정의된다.

DCT는 분리 가능한 연산이다. 이는 2차원 DCT가 2개의 연속적인 일차원 DCT 연산들로 계산될 수 있다는 것을 의미한다. 2차원 DCT의 복잡도가 N²에 대응될 때 1차원 DCT의 복잡도는 N에 대응되기 때문에 1차원 DCT 연산을 이용하는 것이 선호된다. NxN의 크기를 가진 이미지 데이터에 대해, 모든 DCT 연산의 총 복합도는 고속 DCT에 있어서 N³또는 N²log(N)에 상응한다. 따라서 많은 사소하지 않은(non-trivial) 곱셈식들까지 포함하는 대규모 변환들은 계산상 매우 복잡하다. 또한, 추가로 요구되는 비트 단위의 정확도가 워드 폭을 증가시킬 것이다. 복잡도의 이유 때문에 DCT는 일반적으로, 한번에, 가령 4x4, 또는 8x8 값과 같은 작은 블록으로 된 값들에 대해서만 수행되는데, 여기서 이 작은 블록값들은 f() 값들을 가진 매트릭스 형태로 표현될 수 있다. 도 1은 그러한 4x4 매트릭스(1)의 DCT를 도시한 것이다.

먼저, 매트릭스(1)의 각 행이 개별적으로 변환되어져 일차 변환된 매트릭스(2)를 형성한다. 도시된 매트릭스(1)에서, 각 행의 개별 변환은 각 행의 모든 값들을 포괄하는 양방향 화살표들에 의해 나타내어지고 있다. 그 후, 일차 변환된 매트릭스(2)의 각 열이 개별적으로 변환되어져, 변환 변수들 F()을 포함하는 최종 변환 매트릭스(3)를 형성한다. 도시된 매트릭스(2)에서, 각 열의 개별 변환은 각 열의 모든 값들을 포괄하는 양방향 화살표에 의해 나타내어진다.

상술한 식에 의해 정의된 DCT는 매트릭스 형태로 쓰여질 수도 있다. 이를 위해, F(i)가 먼저 보다 적합한 형태로 다음의 식과 같이 쓰여진다.

매트릭스 A는 DCT 기반 함수들로 된 매트릭스이다. 그리고나서 2차원 DCT가 다음의 식으로 산출될 수 있다:

Y=AXA^T

상기 매트릭스 X는 소스값 매트릭스를 나타내며, 상기 매트릭스 Y는 DCT로 끝나는 변환 계수들을 나타낸다. 매트릭스의 지수 T는 행렬이 전치되었음을 나타낸다.

DCT 후, DCT 계수들의 양자화에 의해 실질적인 압축이 이뤄진다. 양자화는 그 변환 계수들을 양자화 패러미터 qp에 종속되는 양자화값으로 나눔으로써 이뤄진다:

Y'(i,j)=Y(k,j)/Q(qp)(i,j)

상기 Q(qp)는 양자화 매트릭스이고, Y'(i,j)는 양자화된 계수들을 구성한다. 양자화의 가장 간단한 식은 양자화 매트릭스가 하나의 상수로 존재하는 단일 양자화이며, 그 예가 다음의 식이다:

Q(qp)(i,j)=qp

양자화된 계수들은, 가령, 인코딩 및 그후 있을 수 있는 처리 단계들 다음에 상기 데이터의 전송을 위해 용이한 형태를 갖는 압축 디지털 데이터를 구성한다.

압축 데이터가 저장 및/또는 전송 후에 제공될 때, 그것은 먼저 다시 압축 해제되어야 한다.

압축 해제는 압축 중에 행해진 연산을 반대로 함으로써 수행된다. 그에 따라, 양자화된 계수들 Y'(i,j)은, 그 양자화된 계수들과 양자화 매트릭스의 값들을 곱하는 최초의 단계에서 다음과 같이 역양자화된다:

Y(i,j)=Y'(i,j)Q(qp)(i,j)

다음으로, 양자화 해제되었지만 여전히 변환형 계수들인 Y(i,j)가 역이산 코사인 변환(IDCT)에 의해 두번째 단계에서 역변환된다:

X=A^TYA

상기 매트릭스 Y는 DCT의 변환 계수들을 나타내며, 매트릭스 X는 복구된 소스 값 매트릭스를 나타낸다.

모든 계산에 대해 무한 정밀도가 이용된다면, X는 바로 원래의 픽셀값들을 포함할 것이다. 그러나 실제로는, 계수들이 적어도 역양자화 및 역변환 이후에 정수값들로 전환된다. 그 결과, 원래의 픽셀들이 정확히 재구현될 수 없다. 더 많은 압축이 이뤄질수록, 원래의 픽셀들로부터 더 큰 편차가 존재하게 된다.

상술한 DCT 및 IDCT가 용이하게 구현될 때, 각 변환은 여러 곱셈, 덧셈 및/또는 뺄셈들을 필요로한다. 이들 연산들은 그러나 한편으로 상당한 량의 프로세서 시간을 요구하며, 한편 곱셈들은 어떤 구조의 회로 면적에 대해 매우 고비용이 드는 연산들이다. 가령 고화질 모션 디스플레이를 전송할 수 있기 위해서는, 압축해제시 복원되는 데이터의 품질을 떨어뜨리지 않으면서 약간의 곱셈 단계들을 필요로 하는 변환 프로세스를 처리하는 것이 바람직하다.

DCT 역시 많은 이미지 코딩 표준에 있어 중심적인 연산이기 때문에, 널리 사용되고 있으며 논의된 문제들의 다양한 해법들이 문헌 상에 기술되어졌다. 이러한 해법들은 일반적으로 "버터플라이 연산"을 특징으로 하고/하거나 DCT 프로세스 말미에 연산자 매트릭스로부터의 어떤 계산식을 양자화 단계와 결부시킨다.

미국 특허번호 5,523,847은 예를 들어 컬러 이미지 압축에 대한 디지털 이미지 프로세서를 기술하고 있다. DCT의 사소하지 않은 곱셈 수를 줄이기 위해, 이특허 문서에서는 사소하지 않은 곱셈의 개수를 줄이는 방법으로 변환 매트릭스를 분해하는 것을 제안하고 있다. 이때 사소하지 않은 곱셈이란 2의 멱수 이외의 팩터에 의한 곱셈식 또는 나눗셈식을 말한다. 사소한 곱셈식들은 비트 쉬프트(bit shift)에 의해 구현될 수 있고, 그때문에 '사소하다'고 부를 수 있다. 보다 상세히 설명하면, 변환 매트릭스는 대각선 팩터 및 축척(scaled) 팩터로서 분해되고, 이때 대각선 팩터는 추후의 양자화 단계에 병합될 수 있고, 축척 팩터는 최소의 사소하지 않은 곱셈식들을 갖는 데이터 벡터와 곱해질 수 있다. 또, 나머지 사소하지 않은 곱셈식들은 유리수들에 의한 곱셈식들로 근사화된다는 것이 제안되고 있는데, 그러면 계산이 단지 덧셈, 뺄셈 및 쉬프트 연산들로만 이뤄질 수 있기 때문이다. 이것은 그러나 근사화시 변환에 대한 정확한 역변환이 더 이상 존재할 수 없기 때문에 IDCT에 있어서 문제를 야기하게 된다. 따라서, DCT-IDCT 프로세스를 반복하는 것은 화질의 심각한 저하를 가져올 것이다. 이것은, 가령, 이미지가 DCT 압축이 사용되는 통신 링크들을 통해 수차례 전송될 때 일어날 수 있다.

또 다른 방법은 Gisle Bjontegaard에 의해, 2001년 4월 2-4일에 미국 텍삿 오스틴의 ITU 비디오 코딩 전문가 그룹의 13번째 미팅에서 기술된 문서인 "H.26L 테스트 모델 롱 텀 넘버 7 (TML-7) 드래프트0"에 나와 있다. 이 문서는 ITU-T 권고안 H.26L에 대한 압축 방법을 위한 현재의 테스트 모델을 구성하는 DCT 방식에 대해 설명한다. 이 문서에 따르면, DCT 대신, 기본적으로 4x4 DCT와 동일한 코딩 특성을 가진 정수 변환이 사용될 수 있다. 정수 변환에서, 네개의 소스 데이터 픽셀들을 소정의 가중치와 합하는 네 개의 선형 식에 의해 각각 네 개의 소스 데이터픽셀들로부터 네 개의 변환 계수들이 얻어진다. 이 변환 다음에 일반적 양자화/역양자화를 수행하는 양자화/역양자화 프로세스가 뒤따르거나, 양자화/역양자화 프로세스 다음에 그 변환이 뒤따른다. 또한 정규화가 필요로 되는데, 이는 정규화 분포를 갖는 데이터를 전송하는 것이 랜덤 데이터를 전송하는 것 보다 효율적이기 때문이다. 이 변환은 정규화를 포함하지 않기 때문에, 양자화/역양자화는 역변환 이후 마지막 쉬프트에 의해 완료되는 정규화를 추가로 수행한다. 양자화/역양자화는 32개의 서로 다른 품질 패러미터(QP) 값들을 이용하는데, 이들은 하나의 QP에서 다음까지의 스텝 크기가 약 12% 증가하는 방식으로 정해진다. 이러한 방식의 단점은 32비트의 연산 및 그 이상의 많은 수의 연산들을 필요로 한다는 데 있다.

인용한 TML-7 문서로부터 또 다른 문서가 실시된다: Jie Liang, Trac Tran 및 Pankaj Topiwala에 의해 2001년 4월 2-4일 미국 오스틴에서의 비디오 코딩 전문가 그룹(VCEG) 13번째 미팅의 VCEG-M16 문서에 수록된 "DCT 변환 및 양자화를 다룬, H.26L을 위한 16비트 아키텍춰"가 그것이다. 이 VCEG-M16 문서는 주로 4x4 변환에 집중하고 있으며, H.26L 표준을 위한, binDCT로 명명된 4-포인트 DCT의 고속 근사화를 제안한다. 이 binDCT는 가산 및 오른쪽 쉬프트 연산을 가지고만 구현될 수 있다. 제안된 이 방법은 손실없는 코딩을 위해 완전한 역연산이 가능하도록 구현될 수 있다.

이 제안된 binDCT는 DCT 매트릭스의 첸-왕 평면 로테이션 기반의 인수분해에 기반한다. binDCT의 16 비트 구현에 있어서, DCT의 고속 근사화를 달성하기 위해 리프팅(lifting) 체계가 이용된다. 사용되는 각 리프팅 단계는배직교(biorthogonal) 변환이며, 그 반대 역시 간단한 리프팅 구조이다. 이는 리프팅 단계를 반전하려면 앞서의 변환시 가산했던 것을 감산시킨다는 것을 의미한다. 따라서, 원래의 신호는 동일한 절차가 두 직변환 및 역변환 모두에 적용되는 한, 유동소수점 곱셈 결과가 사사오입되어 정수로 된다고 하더라도 완벽하게 재구성될 수 있게 된다.

고속 구현을 달성하기 위해서, 유동 소수점 리프팅 계수들이, k 및 m이 정수인 k/2m 식으로 표현되는 유리수에 의해 근사화되며, 이것은 쉬프트 및 덧셈 연산만으로 구현될 수 있다. 또한 리프팅 기반의 고속 DCT의 복잡도를 줄이기 위해서는 축척된 리프팅 구조가 사용되어 평면 로테이션을 재현한다. 축척 팩터들은 양자화 단계에서 병합될 수 있다.

VCEG-M16 문서에 제안된 해법은 소스 값들이 9 비트 값들임이 전제된 16비트 연산들만을 필요로 하며 TML-7 문서의 해법 보다는 적은 연산을 필요로 한다. 보다 상세히 말하면, 이 해법은 4 데이터의 1차원 DCT를 위해 10번의 덧셈 및 5번의 쉬프트를 필요로 한다.

이미지 데이터 압축과 관련된 또 다른 문서들이 예를 들면 이하와 같이 그 내용이 간단히 언급될 수 있다:

2001년 2월 13일 허여된 미국 특허 번호 6,189,021는 두 개의 1차원 DCT 연산 중 하나를 위한 6 단계의 DCT 고속 알고리즘 중 고유의 곱셈 단계에서 축적된 가중 계수들의 집합을 사용할 것을 제안하며, 이렇게 함으로써 상기 1차원 DCT 연산 중 나머지 하나에 대한 DCT 고속 알고리즘의 해당 단계를 생략할 수 있게 된다.

1992년 7월 7일 허여된, 미국 특허 번호 5,129,015는 DCT와 유사한 방법을 이용하는 것이나, 곱셈식 없이 정지 영상을 압축하기 위한 보다 간단한 수리식을 이용한다.

1996년 11월 5일 허여된 미국 특허 번호 5,572,236은 컬러 이미지 압축을 위한 디지털 이미지 프로세서에 관한 것으로, 사소하지 않은 곱셈식이 단일 프로세스 단계로 합해지도록 DCT 프로세스를 재구성함으로써 DCT 프로세스의 사소하지 않은 곱셈의 개수를 줄인다.

2001년 5월 3일 공개된 PCT 출원 WO 01/31906은 로칼 제로 트리 코딩이라 불리는 변환 기반 이미지 압축 프레임워크에 관한 것이다.

본 발명은 디지털 데이터 처리에 관한 것으로, 보다 상세하게는, 디지털 데이터, 특히 디지털 이미지 데이터에 대해서 그 압축을 위해 연속하여 적용되는 근사 이산 코사인 변환(DCT) 및 양자화를 구현하는 방법에 관한 것이다. 본 발명은 또한, 디지털 데이터의 압축해제를 위한, 비양자화 및 근사 역이산 코사인 변환(IDCT)을 구현하는 방법에 관한 것으로, 디지털 데이터의 압축 해제를 위해 압축된 디지털 데이터에 대해 상기 역양자화가 상기 역변환과 연속하여 적용된다. 마지막으로, 본 발명은 상기 압축 및 압축 해제를 각각 수행하기 적합한 인코더 및 디코더에 관한 것이다.

이하에서, 본 발명은 도면을 참조해 보다 상세히 설명될 것이다.

도 1은 4x4 매트릭스에 적용된 DCT를 도시한 것이다.

도 2는 본 발명의 일실시예에 따른, 압축 및 압축해제를 위해 사용되는 인코더 및 디코더의 블록도를 개략적으로 도시한 것이다.

본 발명의 목적은 사소하지 않은 곱셈의 필요성을 피하면서 통상적인 DCT 및 IDCT에 요구되는 연산을 줄이도록 하는 것이다. 본 발명의 다른 목적은 일반적인 DCT 또는 IDCT 보다 적은 연산을 필요로하는, 기존 방식들의 대안을 제공하는 데 있다. 본 발명의 또 다른 목적은 압축해제 이후의 디지털 데이터의 고품질을 보장하도록 하는데 있다.

디지털 데이터의 압축에 있어서, 본 발명의 목적들은 디지털 데이터에 적용될 때 보다 적은 연산을 필요로 하기 위해 소정 변환 매트릭스를 단순화하는 제1단계를 포함하는 방법에 의해 달성된다. 제2단계에서, 무리수로 이뤄진 단순화된 변환 매트릭스의 성분들은 유리수들에 의해 근사화된다. 제3단계에서, 소정 양자화는 유리수에 의해 단순화된 변환 매트릭스 성분들에 대한 근사화를 보상하기 위해확장된다. 확장된 소정 양자화는 가령 소정 변환 매트릭스의 단순화시 제거되었던 연산들을 포함할 수 있고, 그 포함된 연산들은 유리수에 의해 단순화된 변환 매트릭스의 성분들에 대한 근사화를 보상하는데 적합하도록 된 것이다. 그러면 근사화된 성분들을 가진 단순화된 변환 매트릭스 및 확장된 양자화는, 압축될 디지털 데이터에 적용될 변환 및 양자화의 시퀀스를 구축하기 위한 기초적인 것으로서 사용될 수 있다.

압축된 디지털 데이터의 압축해제를 위한 본 발명의 목적은, 소정 역변환 매트릭스가 압축을 위해 제안된 방법의 소정 변환 매트릭스에 따라 처리되는 방법과 함께 달성된다. 또한, 소정 역양자화는 그 압축을 위해 제안된 방법에서의 소정 양자화의 외연에 따라 확장된다. 그리고 나서, 결과적으로 확장된 역양자화 및 근사화된 성분을 갖는 결과적으로 단순화된 역변환 매트릭스가, 압축해제를 위해 압축된 디지털 데이터에 적용될 역양자화 및 역변환 시퀀스를 구현할 기초적인 것으로서 사용될 수 있다.

본 발명의 목적은 마지막으로, DCT를 근사화한 해당 변환기 및 해당 양자화 수단을 구비한 인코더와, 해당 역양자화 수단 및 IDCT를 근사화한 해당 변환기를 구비한 디코더에 의해 달성된다.

본 발명은 한편으로 연산들이 변환 매트릭스로부터 추출되어 양자화시 병합되거나, 다른 한편으로 유리수로 이뤄지지 않은 나머지 엔트리들이 유리수에 의해 근사화될 때, DCT에 필요한 연산 회수를 크게 줄일 수 있다는 개념으로부터 진행된다. 그러나 압축해제가 바르게 수행될 수 있도록 보장하기 위해서는, 그 근사화가양자화로 이동한 연산들에서 추가로 보상되어야 함이 제안된다.

본 발명의 장점은 가령 TML-7 및 VCEG-M16과 비교해 필요로 되는 연산 회수를 줄일 수 있기 때문에 고속 계산이 가능하다는 데 있고, 그에 따라 프로세서 시간을 절약할 수 있게 된다. 또, 본 발명은 VCEG-M16 문서의 해법과 매우 근접한 품질에 도달한다. 본 발명은 또 수행된 근사화를 보상함으로써 변환 연산의 역 특성을 고려할 수 있으므로, 특히 저 비트율에서 처리된 데이터의 품질 저하를 피할 수 있다. 그에 따라 본 발명의 또 다른 장점은 가령 미국 특허 번호 5,523,847과 비교해 보다 우수한 역전(inversion) 정확도가 달성될 수 있다는데 있다.

본 발명의 바람직한 실시예들은 종속 청구항들로부터 명확해질 것이다.

디지털 데이터에 적용시 보다 적은 연산을 필요로 할 소정 변환 매트릭스를 단순화하는 제안된 단계는 소정 변환 매트릭스를 두 개의 팩터로 분해하는 단계를 포함함이 바람직하며, 그 하나의 팩터는 대각 매트릭스를 구성하고, 나머지 팩터는 단순 변환 매트릭스를 구성한다. 대각 매트릭스는 단순 변환 매트릭스로부터 제거된 연산들을 구비한다.

바람직하게는, 단순 변환 매트릭스의 나머지 엔트리들이 근사화된 유리수들은 n이 정수인 분모 2ⁿ을 가진 분수로서 주어진다. 이러한 유리수들은 이진 연산에 특히 적합한데, 이는 2ⁿ을 곱하거나 그것으로 나누는 것이 비트-쉬프트 동작에 의해 구현될 수 있기 때문이다. 따라서 제안된 근사화가 이뤄진 DCT에서 모든 곱셈들을 피할 수 있다.

가령 4x4 DCT 매트릭스와 같은 소정 변환 매트릭스 및, 단순화된 매트릭스의 나머지 엔트리들을 근사화하기 위한 선택된 유리수에 있어서, 덧셈, 뺄셈 및 쉬프트들만을 포함하는 수식들의 단일 집합이, 일차원 또는 이차원 디지털 데이터 값들을 변환하기 위해 수행되어야 하는 각각의 일차원 변환에 대해 정해질 수 있다.

양자화 스텝에 있어 근사화에 대한 적응은 적용된 변환이 역변환을 가지도록 보장함이 바람직하다. 이는 A가 여기서 나머지 엔트리들의 근사화 이후, 그리고 추출된 연산들의 근사화에 대한 보상 이후에 모든 추출된 연산들이 단순화된 변환 매트릭스에 다시 포함되는 매트릭스인 경우, A^TA=I를 확실히 함으로써 달성될 수 있다. 이것은 IDCT의 근사화가 양호한 품질로서 수행될 수 있음을 보장한다.

가령 4x4 DCT 매트릭스인 소정 변환 매트릭스에 대해, 그리고 단순화된 매트릭스의 나머지 엔트리들을 근사화하기 위한 선택된 유리수의 경우에 있어서, 추출된 연산들의 고유 값들에 대해 요구되는 조정(적응) 역시 일반적인 방식으로 계산될 수 있다.

그러나, 8x8 변환과 같은 대규모 변환들에서는, 최적 구현시 DCT 변환 계수들을 근사화하는 것이 불완전한 직-역변환 쌍을 야기하므로 단순화된 매트릭스의 근사화에 대한 적응이 추가적으로 필요하게 될 것이며, 이것이 인접하지 않은 픽셀들, 즉 2 픽셀 멀리 떨어진 픽셀들에 픽셀값들을 "번지게(spill)" 할 것이다. 이는 이미지 번짐을 파생시킨다. 근사화의 올바른 선택에 따라, 단위 매트릭스의 직역변환에서 파생된 매트릭스의 대각선 이외의 성분들이 모두 0이 된다. 대규모 매트릭스들에서는, 근사화를 충분히 적응시키는 것이 가능하지 않을 수 있다. 그러한 경우, 근사화는 최소자승의 방향으로 최적의 결과를 도출하도록 적응될 수 있다. 또, 최적화는 디리클레 집합, 즉 어떤 유리수들로 결과를 제한시킬 필요가 있다.

본 발명의 양자화 단계에 있어서, 양자화 매트릭스는, 소정 시퀀스의 양자화 계수들을 변환 매트릭스를 단순화하기 위해 변환 매트릭스로부터 추출된 매트릭스와 곱함으로써 결정됨이 바람직하다. 추출된 매트릭스는 소정 변환 매트릭스로부터 추출된 연산들을 포함하며 유리수에 의해 단순화된 변환 매트릭스의 나머지 엔트리들의 근사화를 보상하도록 적응된다.

본 발명의 방법은 이차원 변환에 이용되는 것과 동일하게 일차원 변환에 이용될 수있다. 이차원 디지털 데이터에 적용될 이차원 변환에 있어서, 소정 변환 매트릭스 및 단순화된 변환 매트릭스의 전치에 대해 단순화 및 근사화가 수행된다. 이들 두 매트릭스들은 그리고나서 변환을 구현하기 위한 기초적인 것으로서 사용된다. 확장된 양자화는 여기서, 상기 매트릭스들 모두로부터 제거된 연산들을 포함하며, 그 연산들은 상기 두 매트릭스들의 근사화에 대해 보상하도록 조정된다.

제공되는 바람직한 실시예들은 변환 및 양자화를 구현하기 위한 본 발명에 따른 방법에 대해서만 이용될 수 있는 것이 아니고, 상응하는 방식으로 역변환 및 역양자화를 구현하는 방법과, 본 발명에 따른 인코더 및 디코더에 대해서도 이용될 수 있다.

실제로, 변환을 위해 산출된 변환 매트릭스들은 일반적으로, 변환을 위한 연산자 매트릭스가 DCT 변환 매트릭스와 같이 단일한 것일 때, 어떤 별도의 계산을 수행하지 않고도 역 변환을 위한 전치 형식으로 사용될 수 있다. 이 경우, 확장된 양자화에 포함될 연산들은 소정 역양자화의 확장에 대해 동일한 시간대에 동일하게 사용될 수 있다.

본 발명은 가령 GSM(Global System for Moile communication) 또는 UNTS(Universal Mobile Telecommunication System)과 같은 이동 통신 시스템에서 임의 용도의 임의 디지털 데이터 종류의 압축을 위해 이용될 수 있다.

본 발명은 예를 들어 엠펙(MPEG) 코덱의 일부로서 구현될 수 있다.

본 발명의 다른 목적 및 특징들은 첨부된 도면을 참조하여 이하의 상세 설명으로부터 명확히 알 수 있을 것이다. 그러나, 도면들은 예시할 목적으로만 도시된 것으로 본 발명의 범위에 대한 정의로서 도시된 것이 아님을 이해할 수 있을 것이며, 대신 본 발명의 범위는 첨부된 청구항들로부터 참조되어야 할 것이다.

도 1은 위에서 이미 설명하였다.

도 2의 블록도는 본 발명이 구현할 수 있는 전형적인 시스템의 구성요소들을포함한다. 도 2의 왼편에 인코더(4)가 도시되었다. 인코더(4)는 비디오 데이터를 제공 및 전송할 수 있는 이동 통신 시스템의 사용자 기기의 일부 등과 같은, 제1유닛의 부분이다. 입력 및 출력 사이에 연결된 채, 인코더(4)는 DCT 변환기(41), 양자화 수단(42) 및 부가 수단(43)을 구비한다. 도 2의 오른편에 디코더(5)가 도시되었다. 디코더(5)는 비디오 데이터를 수신 및 표시할 수 있는 이동 통신 시스템의 사용자 기기의 일부 등과 동등한, 제2유닛의 일부이다. 입력 및 출력 사이에 연결된 채, 디코더(5)는 수단(53), 역양자화 수단(52) 및 IDCT 변환기(51)를 구비한다.

비디오 데이터가 가령 통신 네트웍을 통해, 제1유닛에서 제2유닛으로 전송되는 경우, 비디오 데이터는 제1유닛의 인코더(4)에 디지털 데이터로서 제공된다. 인코더(4)에서, 그 디지털 데이터는 먼저 DCT 변환기(41)에 의해 변환되고, 그리고나서 양자화 수단(42)에 의해 양자화된다. 양자화 이후, 그 데이터는 부가 수단(43)에 의해 추가로 처리된다. 이 처리에는, 추가 압축에 뒤따를 수 있는 전송을 위한 양자화 데이터의 부호화가 포함되지만, 그것은 본 발명과 관련된 것이 아니므로 여기서 다뤄지지는 않는다.

처리된 데이터는 인코더(4)를 구비한 제1유닛에서 디코더(5)를 구비한 제2유닛으로 전송된다. 제2유닛은 그 데이터를 수신하고 그것을 디코더(5)로 전송한다. 디코더(5)에서는, 제1단계로서 수단(53)에서 어떤 처리가 수행되며, 그 처리란 인코더(4)의 블록(43)에서의 처리 방식의 반대에 해당한다. 따라서, 그 처리란, 여기서 다뤄지진 않았으나, 압축해제라는 제1단계에 앞설 디코딩을 포함할 것이다.처리된 데이터는 그리고나서 역양자화 수단(52)에 의해 역양자화되고, 또한 IDCT 변환기(51)에 의해 IDCT 처리된다. IDCT(51)에 의해 제공된 재생 비디오 신호들은 제2유닛에 의한 디스플레이를 위해 디코더(5)에서 사용자에게 출력된다.

도 2의 인코더(4)의 DCT 변환기(41) 및 양자화 수단(42)의 구현에 대한 본 발명에 따른 실시예가 이제부터 도출될 것이다. 상술한 발명의 배경에 기술된 것과 같은 DCT 및 양자화를 진행하는 이러한 실시에 있어서, 입력 디지털 이미지 데이터의 압축은 4x4 값들을 구비한 디지털 데이터의 블록들에 대해 수행되어야 한다는 것을 전제한다. 도 2의 디코더(5)의 역양자화 수단(52) 및 IDCT 변환기(51)에 의한, 해당 압축 해제 구현에 대한 본 발명의 실시예가 역시 기술될 것이다.

제시된 수식들에서, 동일한 명칭이 다른 매트릭스에 대해 다른 수식들 안에서 사용될 수도 있다. 적어도 해당 명칭이 이전에 다른 종류의 매트릭스에서 사용되었을 경우 각 매트릭스들의 종류가 각 수식에서 표시될 것이다.

상술한 DCT를 위한 수식에 따르면, Y=AXA^T이고, 4x4 DCT 직접 변환은 다음과 같이 계산될 수 있다:

위에서 Y는 바람직한 변환 매트릭스이고, X는 4x4 소스 값들인 x_ij(i,j=1 ~4)를 포함하는 매트릭스이며, A는 4x4 DCT 변환 매트릭스이다. 매트릭스 A의 값a, b, 및 c는 상술한 A(i,x)의 정의로부터 쉽게 구할 수 있다:

직진(forward) DCT를 위한 식에서, 매트릭스 A는 분해되어, 대각 매트릭스 B와 단순 변환 매트릭스 C를 파생시킨다. 해당 분해는 A의 전치 형식인 A^T에 대해 수행될 수 있다. d가 추가로 d=c/b로서 표현된다면, 직접 DCT는 다음과 같이 쓰여질 수 있다.

B가 대각 매트릭스이므로, 상술한 식은 다음과 같이 쓰여질 수 있다.

는 각각의 두 매트릭스들이 풀(full) 매트릭스 곱셈이 아닌 엔트리 방향으로 곱해진다는 것을 나타낸다.

D와 그 전치 형태인 D^T를 결합하여 E로 만든 후, 최종 DCT는 다음과 같다:

다음 단계에서, 계수 d는 분모 2ⁿ을 가진 유리수에 의해 표현될 수 있는 고정소수점 형태로 전환된다. 8개의 십자리 수를 고려할 때 d의 값은 0.41521356이다. d에 대한 두 개의 가능한 고정 소수점 근사화치가 3/8=0.375 및 7/16=0.4375이고, 둘 모두 같은 수의 가산 및 쉬프트 연산들로 구현될 수 있다. 13/32, 27/64 및 53/128과 같은 보다 정확한 근사화치는 더 많은 가산 및 쉬프트를 필요로 하지만 실제로 이뤄지는 압축은 크게 향상되지 않는다. 따라서, 3/8 보다 d에 더 가까운 7/16이 d의 고정소수점 형태로서 선택된다.

계수 d의 고정소수점 표시 전환 이후, b는 변환이 역변환을 가지는 방식으로 조정되어야 한다. 존재할 역변환의 조건은 다음과 같이 주어진다:

A^TA=I

d의 근사화 이후 팩터 B와 C로부터 재구성된 매트릭스 A에 대해 상기 식을 풀 때, 조정된 b의 조건은 다음과 같다:

그러면 계수 b의 옛값을 새값으로 교체함에 따라 매트릭스 E가 조정된다.

이제, 단순화된 DCT가, 매트릭스 E가 추출되었던 인코더(4)의 DCT 변환기(41)에서 구현될 수 있다. 즉, 이 구현은 C가 근사화된 계수 d를 구비하는 식 Y_c=CXC^T에 기초하며 수정된 DCT 계수 Y_c를 발생시킨다. 매트릭스 E는 이하에서 설명되는 것과 같이 이어지는 양자화 단계와 결부된다.

단순화된 DCT의 실제 구현은 특정 변환기 구조에 따르며, 이 구조에서는 총 연산이 거의 없거나 곱셈이 전혀 없도록 하는 것이 가장 중요하다.

단순화된 DCT 변환기의 구현에 사용될 수 있는 세가지 서로 다른 수식의 집합들이 이제 제안될 것이다. 이 수식들은 위에서 도출된 것과 같은 DCT 변환 매트릭스 C에 기반한 4-포인트 1차원 단순화 DCT를 수행하기 적합한 것들이다. 매트릭스 C에서, 계수 d는 d=7/16이 되게 선택된다. 각 수식들의 집합에서, X[i] (i=0~3)는 변환될 4 가지 값들의 시퀀스를 이루고, Y[i] (i=0~3)는 4개의 변환된 값들의 시퀀스를 구성한다. 여기서 e 및 f는 보조 변수들이다.

첫번째로 제안된 수식들의 집합은,

e=X[0]+X[3]

f=X[1]+X[2]

Y[0]=e+f

Y[2]=e-f

e=X[0]-X[3]

f=X[1]-X[2]

Y[1]=e+7*f/16

Y[3]=7*e/16-f

이 수식들의 집합에서 두 나눗셈은 실제로는 비트 쉬프트이다. 따라서 이 수식들의 집합은 총 12개의 연산에 대해 2개의 곱셈식과 2개의 쉬프트를 필요로 한다.

두번째로 제안된 수식들의 집합은,

e=X[0]+X[3]

f=X[1]+X[2]

Y[0]=e+f

Y[2]=e-f

e=X[0]-X[3]

f=X[1]-X[2]

Y[1]=e+(f-f/8)/2

Y[3]=(e-e/8)/2-f

두번째 수식들의 집합에서는 덧셈 및 쉬프트만을 사용하여 첫번째 집합과 동일한 결과를 발생한다. 나눗셈은 여기에서도 실제로 비트 쉬프트이다. 이 버전은 총 14개의 연산에 대해 10개의 가산과 4개의 쉬프트를 필요로한다. 연산의 개수는 첫번째 버전 보다 많지만, 곱셈이 비용이 많이 드는 연산이라고 할 때 결과적으로 복잡성이 매우 낮아진다. 게다가 곱셈식의 결과는 보다 큰 동적 범위를 필요로 한다.

세번째로 제안된 수식들의 집합은,

e=X[0]+X[3]

f=X[1]+X[2]

Y[0]=e+f

Y[2]=e-f

e=X[0]-X[3]

f=X[1]-X[2]

Y[1]=16*e+7*f

Y[3]=7*e-16*f

세번째 수학식들의 집합은 덧셈 및 곱셈, 또는 덧셈 및 쉬프트를 이용한다. 여기서는 총 12개 또는 14의 연산들에 대해 각각 8개의 덧셈 및 4개의 곱셈 또는 10개의 덧셈 및 4개의 쉬프트들을 필요로 한다. 이 수식들의 집합은 첫번째 및 두번째 수식들의 집합과 동일한 결과를 발생하지 않는다. Y[1] 및 Y[3]의 결과는 다른 수식들의 집합에서 보다 16 배 더 크고, 그에 따라 그 결과에 대한 동적 범위 요건이 훨씬 더 커지게 된다. 그러나 본 발명의 어떤 실시예들에 있어서, 특정 실시예에서의 쉬프트의 복잡성이나 약간 떨어진 정확도를 가지는 결과들로 인해 그 결과들을 쉬프트하지 않는 것이 바람직할 수도 있다. 세번째 수식들의 집합에 따른 어떤 결과들이 16배 더 크기 때문에, 매트릭스 E의 'ab' 및 'b²' 값들은 16 및 16²으로 각각 나눠진다.

제시된 집합들 가운데 어떤 것이라도 변환될 값들의 각 집합에 적용함으로써 이차원 데이터를 변환하는데 사용될 수 있다.

단순화된 변환 다음에는 적응 양자화 단계가 뒤따른다. 양자화의 구현은 사용된 DCT에 의존한다. 상술한 TML-7 문서에서, 균등 양자화가 사용되고 있다. 고속 DCT에서는, 비균등 양자화 매트릭스가 사용되어야 하는데, 이는 DCT 곱셈의 일부가 양자화 곱셈과 결부되기 때문이다. 상술한 문서 VCEG-M16의 binDCT는 또, 양자화를 위한 나눗셈을 이용하고 16비트의 연산만을 필요로 한다. 그러나 나눗셈은 일반적으로 다소 느린 연산이다. 따라서, 제시된 실시예에서는 곱셈만을 이용하는 균등 양자화가 양자화 수단(42)에서 구현된다.

이미 위에서 언급했다시피, 양자화는 다음과 같이 나눗셈을 이용해 수행될 수 있다.

Y'(i,j)=Y(i,j)/Q(qp)(i,j)

나눗셈이 비용이 많이 드는 연산이기 때문에, 곱셈이 대신 사용될 수 있다. 이러한 목적으로 양자화 매트릭스 R이 다음과 같이 산출된다.

R(qp)(i,j)=1.0/Q(qp)(i,j)

그리고나서 양자화는 곱셈식으로 수행될 수 있다:

Y'(i,j)=Y(i,j)R(qp)(i,j)

문서 TML-7에서 제안된 양자화에서, 양자화 계수들은 이하에서 보여지는 것과 같이 근사화된다. 그 이외의 계수들 역시 사용될 수 있을 것이다.

a(qp)=

2.5000, 2.8061, 3.1498, 3.5354, 3.9684, 4.4543, 4.9998,

5.6120, 6.2992, 7.0706, 7.9364, 8.9082, 9.9990, 11.2234,

12.5978, 14.1404, 15.8720, 17.8155, 19.9971, 22.4458,

25.1944, 28.2795, 31.7424, 35.6293, 39.9922, 44.8894,

50.3863, 56.5562, 63.4817, 71.2552, 79.9806, 89.7745.

양자화시 DCT로부터 추출된 매트릭스 E를 병합할 수 있도록 하기 위해, 양자화 패러미터 qp에 대한 양자화 매트릭스 R이 다음과 같이 산출된다.

R(qp)(i,j)=·E(i,j)/a(qp)

최종 양자화된 계수들 Y'(i,j)은 이제 아래의 식에 의한 단순화된 DCT를 발생하는 변환 계수들 Y_c(i,j)로부터 결정될 수 있을 것이다.

Y'(i,j)=Y_c(i,j)·R(qp)(i,j)±f

상기 f는 인트라 블록에 대해 1/3이고 인터 블록에 대해 1/6이며 TML-7 문서에 따른 Y_c(i,j)와 동일한 부호를 가진다. 인트라 블록은 현 이미지 안에서의 값들만을 기초로 부호화되는 매크로블록이며, 인터 블록은 추가로 다른 이미지들 내 값들을 기초로 부호화되는 매크로블록이다. 각 매크로블록은, 가령 현재 예로 든 4x4 블록과 같은 여러 서브블록들로 이뤄지며, 이들 서브블록들은 개별적으로 DCT 변환되고 양자화된다.

그러나, 먼저 양자화는 고정소수점 값들만을 사용하도록 변경된다. 이를 위해, 양자화 이전에 R 및 f의 값들을 2ⁿ으로 곱하고 그 결과를 정수값으로 개산함으로써 고정소수점 값들로 그 값들을 변환한다. n은 고정소수점 값들에 사용되는 분수 비트의 개수이다. n=17을 선택하여, R의 계수들을 16비트로 맞출 수 있게 되고, 이에 따라 양자화시 16 비트 곱셈만이 필요로된다. 보다 상세하게는, 16비트 곱셈은 32비트 결과를 발생하는데 필요로된다.

그러면 고정소수점 양자화는 다음의 식을 기초로 인코더(4)의 양자화수단(42)에서 구현된다

Y'(i,j)=(Y_c(i,j)·R(qp)(i,j)±f)/2ⁿ

상기 R 및 f는 고정소수점 값들만을 구비한다. Y'(i,j)의 값들은 양자화 수단(42)에 이해 요망되는 압축 디지털 이미지 데이터로서 출력된다.

도 2의 디코더(5)에서 압축된 디지털 이미지 데이터를 압축해제하기 위해, 역양자화 수단(52) 및 IDCT 변환기(53)이 인코더(4)의 양자화 수단(42)과 DCT 변환기(41)에 대응하는 방식으로 구현된다. 기본 IDCT는 다음과 같은 기본 DCT로부터 산출된다

X=A^TYA

상기 매트릭스 X는 원하는, 복구된 소스 값들을 포함하고, 상기 매트릭스 A는 원래의 DCT 변환 매트릭스이며, 상기 매트릭스 Y는 본 발명의 배경기술에서 설명된 바와 같은 압축해제에 의해 얻어지는 역양자화 값들을 포함한다.

이 식으로부터 진행시, 역변환은 추출된 매트릭스 E를 이용하는 직접 변환에 대응되도록 수식화될 수 있다:

X=C^T(YE)C

상기 매트릭스 C 및 C^T는 인코더(4)의 블록(41)에서 감소된 DCT에 대해 사용된 매트릭스 C 및 C^T에 해당한다.

이 식의 매트릭스 E는 IDCT에 선행하는 역양자화 단계에서 병합될 수 있다.

이것은 양자화시 병합되는 매트릭스 E와 유사하게 구현될 수 있다. 역양자화 계수들은 양자화 계수들의 역의 값들이다.

매트릭스 E를 포함하는, 양자화 패러미터 qp에 대한 역양자화 매트릭스 Q는 다음과 같이 산출될 수 있다:

Q(qp)(i,j)=E(i,j)·a(qp)

따라서 압축 계수 Y'(i,j)는 다음의 식에 따른 역양자화 계수 X'(i,j)로 역양자화될 수 있다:

X'(i,j)=Y'(i,j)·Q(qp)(i,j)

이 식에서, X'(i,j)는 역변환 X=C^T(YE)C을 이한 상기 식의 항 YE에 해당한다.

고정소수점 수가 사용될 때, Q의 값들은 2ⁿ으로 곱해지고 그 결과를 정수값으로 만듦으로써 역양자화 전에 고정소수점 값들로 전환된다. 역양자화를 위해 n=5를 선택하여 역양자화시의 모든 계산이 오직 16비트 연산들만을 이용해 수행될 수 있다. 그러면 고정소수점 역양자화는 다음의 식에 기반해 디코더(5)의 역양자화 수단(52)에서 구현되다:

X'(i,j)=Y(i,j)·Q(qp)(i,j)

여기서 Q는 단지 고정소수점 수들만을 포함한다. 양자화 후, X'(i,j)의 값들은 2ⁿ에 의해 정규화되어야 하지만, 보다 우수한 정확도에 도달하기 위해 정규화는 최종 IDCT 이후에 행해지도록 연기된다.

그러면 단순화된 역변환이 다음의 식에 따라 디코더(5)의 IDCT 변환기(51)에서 구현될 수 있다:

X=C^TX'C

그 다음 X의 고정소수점 값들이 다음 식에 의해 정수값들로 변환된다:

X(i,j)=(X(i,j)+2^n-1)/2ⁿ

상기 2ⁿ에 의한 나눗셈은 간단한 수리적 비트 쉬프트로서 구현된다.

IDCT 변환기(51)의 실제 구현은 DCT 변환기(41)를 위해 제공된 것들에 대응되는 덧셈, 뺄셈 및 쉬프트들만을 포함하는 수식의 집합을 구비할 수 있다.

본 발명의 다른 실시예에 따르면, 8x8 DCT 및 IDCT가 다음에 제공되는 것과 같이 구현될 수 있다. DCT에 대한 식에 따라, Y=AXA^T, 즉 8x8 전진 DCT 변환이 다음과 같이 산출될 수 있다.

상기 Y는 요망되는 변환 매트릭스이고, 상기 X는 상술한 4x4 실시예에서와 같이, 8x8 소스 값들인 X_ij(i,j=1~8)를 포함하고, 상기 A는 오른쪽 식에서 개괄호로 쓰여진 8x8 DCT 변환 매트릭스이며, A^T는 A의 전치행렬이다. 매트릭스 A의 a, b, c, d, e, f 및 g 값들은 A(i,x)에 대한 상술한 정의로부터 쉽게 구해질 수 있다:

전진 DCT의 식에서, 매트릭스 A는 분해되어 대각 매트릭스 B와 단순화된 변환 매트릭스 C를 파생시킨다. 해당 분해는 A의 전치 형태인 A^T에 대해 수행될 수 있다. x_y=x/y라는 표기를 사용할 때, 전진 DCT는 다음과 같이 쓰여질 수 있다.

B가 대각 매트릭스이므로, 상술한 식은 4x4의 경우처럼, 이하와 같이 쓰여질수 있다.

상기는 각각의 두 매트릭스들이 풀 매트릭스 곱셈이 아닌 엔트리 방향으로 곱해진다는 것을 나타낸다.

D와 그 전치 형태인 D^T의 E로의 병합 이후, 최종 DCT는 다음과 같다:

다음 단계에서, 계수들 c_b, d_b, e_b, 및 g_f는 분모 2ⁿ을 갖는 분수 유리수로 표현될 수 있는 고정소수점 형태로 전환된다. 가까운 근사값이 c_b=7/8, d_b=9/16, e_b=3/16, 및 g_f=7/16이다.

계수들 c_b, d_b, e_b, 및 g_f의 고정소수점 표현으로의 전환 이후, b 및 f가 변환이 역변환을 가지도록 조정되어야 한다. 존재할 역변환의 조건은 다음과 같이다시 주어진다:

A^TA=I

c_b, d_b, e_b, 및 g_f의 근사화 이후 팩터 B 및 C로부터 재구성된 매트릭스 A에 대한 상기 식을 풀 때, 조정된 b 및 f의 조건이 다음과 같이 얻어진다:

그러면 매트릭스 E가, 계수 b와 f의 옛값을 새값으로 대체함으로써 조정된다.

그러나, 조건 A^TA=I를 만족시키기 위해서는 c_b, d_b, 및 e_b의 값들이 서로 다르게 선택되어져야 하는데, 그렇게 하지 않을 때 곱 A^TA가 대각선 이외의 성분들이 0이 아닌 특성을 가지기 때문이다. 8x8의 경우에 대해 필요한 조건은 다음과 같다:

d_b- c_b+ e_b(d_b+ c_b)=0

이것은 c_b=15/16, d_b=9/16 및 e_b=1/4를 선택함으로써 만족될 수 있다.

이제, 단순화된 DCT가 매트릭스 E가 추출되었던 인코더(4)의 DCT 변환기(41)에서 다시 구현될 수 있다. 즉, 이 구현은 식 Y_c=CXC^T를 기반으로 하며, 이때 매트릭스 C는 근사화 계수 c_b, d_b, e_b, 및 g_f를 포함하며, 상기 식의 결과 수정된 DCT 계수들 Y_c가 발생된다. 매트릭스 E는 4x4 DCT에 대해 상술한 것과 유사하게, 이어지는 양자화 단계와 결부될 것이다.

본 발명의 제3실시예에 따르면, 근사화는 변환시 분수의 선택을 최적화함으로써 A^TA=I 조건에 맞춰진다. 분수는 매트릭스 A^TA의 대각선 이외의 성분들이 구현시 가능한 한 0에 가깝도록 선택된다. 최적화의 해법은 디리클레 집합, 즉, 어떤 유리수들로 한정된다.

본 발명의 제4실시예에 따르면, 고속 DCT 알고리즘의 근사화는 변환시 분수의 선택을 최적화함으로써 A^TA=I 조건에 대해 맞춰진다.

전체적으로, 상술한 본 발명의 실시예들로부터 디지털 데이터를 압축하는 다른 효과적인 구현 방식들이 제공됨은 자명한 일이다. 그러한 구현은 기존의 구현 방식들 보다 정확하거나 더 빠르거나, 혹은 둘 다가 되게 실시될 수 있다.

본 발명에 따른 바람직한 실시예들에 적용되는 것과 같이, 본 발명의 기초적인 신규한 특성들이 기술되고 지적되었지만, 이 분야의 당업자들에 의해, 본 발명의 개념으로부터 벗어나지 않으면서 설명된 방법 및 장치들의 형식 및 세부사항에 있어 여러가지 생략 및 대체와 변경이 이뤄질 수 있음이 이해되어질 것이다. 예를 들어, 동일한 결과를 달성하도록 실질적으로 동일한 방식으로 동일한 기능을 수행하는 구성요소들 및/또는 방법의 단계들의 모든 조합들이 본 발명의 범주 안에 있도록 명백히 의도된다. 또, 본 발명의 어느 개시된 형태 또는 실시예와 관련해 도시되고 설명된 구조 및/또는 방법의 단계들은 설계 선택의 일반적 사항으로서 어떤 기타의 개시되거나 설명되거나 제안된 형태 또는 실시예 안에 병합될 수 있다. 따라서, 여기 부가된 청구항들의 범위에 의해 지시된 것에 의해서만 발명의 범위가 한정되어져야 한다.

Claims

디지털 데이터의 압축을 위해 디지털 데이터에 연속해서 적용될 근사 이산 코사인 변환(DCT) 및 양자화 구현 방법에 있어서,

디지털 데이터에 적용될 때 보다 적은 연산이 필요하도록 소정 변환 매트릭스를 단순화하는 단계;

무리수들로 구성된 상기 단순화된 변환 매트릭스의 성분들을 유리수들로 근사화시키는 단계; 및

상기 단순화된 변환 매트릭스 성분들의 유리수들로의 근사화를 보상하기 위해 소정의 양자화를 확장시키는 단계를 포함함을 특징으로 하는 이산 코사인 변환(DCT) 및 양자화의 근사화 구현 방법.
제1항에 있어서, 상기 디지털 데이터에 적용될 때 보다 적은 연산이 필요하도록 소정 변환 매트릭스를 단순화하는 단계는, 상기 소정 변환 매트릭스를 상기 소정 양자화 확장에 사용될 대각 매트릭스 및 단순 변환 매트릭스로 분해하는 단계를 포함함을 특징으로 하는 근사 이산 코사인 변환(DCT) 및 양자화 구현 방법.
제1항 또는 제2항에 있어서, 상기 유리수들은 n이 정수일 때 2ⁿ과 같은 분모를 가진 분수로서 표현됨을 특징으로 하는 근사 이산 코사인 변환(DCT) 및 양자화구현 방법.
제3항에 있어서, 상기 변환 구현시, 나눗셈은 비트 쉬프트에 의해 실현됨을 특징으로 하는 근사 이산 코사인 변환(DCT) 및 양자화 구현 방법.
제1항 내지 제4항 중 어느 한 항에 있어서, 상기 근사화는, 변환 결과가 역변환을 가지도록, 즉 상기 근사화를 포함한 상기 소정 변환 매트릭스의 전치 매트릭스와 상기 근사화를 포함한 상기 소정 변환 매트릭스의 곱이 단위(identity) 매트릭스가 되게하는 방식으로 조정됨을 특징으로 하는 근사 이산 코사인 변환(DCT) 및 양자화 구현 방법.
상기 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 소정의 변환 매트릭스는 이하와 같은 형태의 4x4 매트릭스이고,

이때 a=1/2, b=, c=이고, 상기 'c'는 식 d=c/b에 따라 상기 매트릭스 내에서 대체되고, 상기 소정 변환 매트릭스는 대각값들인 {a,b,a,b}를 구비하는 대각 매트릭스와 '1'과 'd'의 절대값들을 구비한 성분들만 포함하는 단순 변환 매트릭스로 분해하여 단순화되고, 상기 대각 매트릭스는 상기소정 양자화 확장에 사용됨을 특징으로 하는 근사 이산 코사인 변환(DCT) 및 양자화 구현 방법.
제6항에 있어서, 상기 단순 변환 매트릭스에서 상기 'd' 값은 유리수 7/16에 의해 근사화됨을 특징으로 하는 근사 이산 코사인 변환(DCT) 및 양자화 구현 방법.
제6항에 있어서, 상기 단순 변환 매트릭스에 있어서 상기 'd' 값은 유리수에 의해 근사화되고, 상기 대각 매트릭스의 상기 'b' 값은 'd'가 상기 유리수일 때 식으로 적응됨을 특징으로 하는 근사 이산 코사인 변환(DCT) 및 양자화 구현 방법.
제6항에 있어서, 상기 단순 변환 매트릭스에 있어서 상기 'd' 값은 유리수 7/16에 의해 근사화되고, 상기 변환은 네 개의 값 X[0], X[1], X[2], X[3]들의 1차원 시퀀스로 된 변환에 대해 이하의 식으로 구현되고,

e=X[0]+X[3]

f=X[1]+X[2]

Y[0]=e+f

Y[2]=e-f

e=X[0]-X[3]

f=X[1]-X[2]

Y[1]=e+(f-f/8)/2

Y[3]=(e-e/8)/2-f

상기 Y[0], Y[1], Y[2], Y[3]은 네개의 변환값들로 된 일차원 시퀀스이고, 상기 e 및 f는 보조 변수들임을 특징으로 하는 근사 이산 코사인 변환(DCT) 및 양자화 구현 방법.
제1항 내지 제5항 중 어느 한 항에 있어서, 상기 소정 변환 매트릭스는 이하의 형태로 된 8x8 매트릭스이고,

상기,,,이고, 상기 'c'는 상기 매트릭스에서 c_b=c/b에 따라 대체되고, 상기 'd'는 상기 매트릭스에서 d_b=d/b에 따라 대체되고, 상기 'e'는 상기 매트릭스에서 e_b=e/b에 따라 대체되고, 상기 'g'는 상기 매트릭스에서 g_f=g/f에 따라 대체되며, 상기 소정 변환 매트릭스는 대각값들인{a,b,f,b,a,b,f,b}를 구비한 대각 매트릭스와 '1', 'c_b', 'd_b', 'e_b', 및 'g_f'의 절대값들을 구비한 성분들만을 포함하는 단순 변환 매트릭스로 분해되고, 상기 대각 매트릭스는 상기 소정 양자화 확장에 사용됨을 특징으로 하는 근사 이산 코사인 변환(DCT) 및 양자화 구현 방법.
제10항에 있어서, 상기 단순 변환 매트릭스에서 상기 'c_b'는 유리수 15/16에 의해 근사화되고, 상기 'd_b'는 유리수 9/16에 의해 근사화되고, 상기 'e_b'는 유리수 1/4에 의해 근사화되며, 상기 'g_f'는 유리수 7/16에 의해 근사화됨을 특징으로 하는 근사 이산 코사인 변환(DCT) 및 양자화 구현 방법.
제10항에 있어서, 상기 단순 변환 매트릭스에서 상기 'c_b', 'd_b', 'e_b', 및 'g_f' 값들은 유리수들로 근사화되고, 상기 대각 매트릭스에서 상기 'b' 및 'f' 값들은 'c_b', 'd_b', 'e_b', 및 'g_f'가 상기 유리수들일 때과으로 조정됨을 특징으로 하는 근사 이산 코사인 변환(DCT) 및 양자화 구현 방법.
제1항 내지 제12항 중 어느 한 항에 있어서, 이차원 디지털 데이터에 적용될이차원 변환에 있어서, 상기 근사화된 성분들을 가진 상기 단순화된 소정 변환 매트릭스 및 상기 근사화된 성분들을 가진 상기 단순 변환 매트릭스의 전치 매트릭스가 상기 변환과, 상기 매트릭스들 모두로부터 제거되어 상기 매트릭스들 모두에서 상기 근사화를 보상하도록 적응된 연산들을 포함하는 상기 확장된 양자화를 구현할 근거로서 사용됨을 특징으로 하는 근사 이산 코사인 변환(DCT) 및 양자화 구현 방법.
제1항 내지 제13항 중 한 항에 있어서, 상기 양자화에 있어서, 양자화 매트릭스는 소정 양자화 계수들의 시퀀스에, 상기 소정 변환 매트릭스를 단순화하기 위해 상기 소정 변환 매트릭스로부터 추출된 매트릭스를 곱함으로써 정해지고, 상기 추출된 매트릭스는 상기 소정 변환 매트릭스로부터 제거된 상기 연산들을 포함하고 상기 단순화된 변환 매트릭스의 성분들에 대한 유리수들에 의한 상기 근사화를 보상하도록 조정됨을 특징으로 하는 근사 이산 코사인 변환(DCT) 및 양자화 구현 방법.
디지털 데이터의 압축 해제를 위해, 압축 디지털 데이터에 대해 역양자화와 그에 이어서 역이산 코사인 변환(IDCT)이 적용되는, 역양자화 및, 근사 역이산 코사인 변환(역변환)을 구현하는 방법에 있어서,

디지털 데이터에 적용될 때 보다 적은 연산들을 필요로 하도록 소정 역변환 매트릭스를 단순화시키는 단계;

무리수들로 이뤄진 상기 단순화된 역변환 매트릭스의 성분들을 유리수에 의해 근사화시키는 단계; 및

상기 단순화된 역변환 매트릭스의 성분들의 유리수에 의한 상기 근사화를 보상하도록 소정 역양자화를 확장하는 단계를 포함함을 특징으로 하는 역양자화 및 역변환 근사화 구현 방법.
제15항에 있어서, 상기 역양자화에 있어서, 역양자화 매트릭스는 소정 역양자화 계수들의 시퀀스를, 상기 소정 역변환 매트릭스를 단순화하도록 상기 소정 역변환 매트릭스로부터 추출된 매트릭스와 곱함으로써 정해지고, 상기 추출된 매트릭스는 상기 소정 역변환 매트릭스로부터 제거된 상기 연산들을 포함하며 또한 상기 단순화된 역변환 매트릭스의 성분들의 유리수들에 의한 근사화를 보상하도록 적응됨을 특징으로 하는 역양자화 및 역변환 근사화 구현 방법.
제15항 또는 제16항에 있어서, 상기 디지털 데이터에 적용될 때 보다 적은 연산들을 필요로 하도록 소정 역변환 매트릭스를 단순화시키는 단계는, 상기 소정 역변환 매트릭스를, 상기 소정 역양자화를 확장하는데 사용될 대각 매트릭스와 단순 역변환 매트릭스로 분해함을 특징으로 하는 역양자화 및 역변환 근사화 구현 방법.
제15항 내지 제17항 중 어느 한 항에 있어서, 상기 유리수들은 n이 정수일때 분모 2ⁿ을 가지는 분수로 표현될 수 있음을 특징으로 하는 역양자화 및 역변환 근사화 구현 방법.
제18항에 있어서, 상기 역변환 구현시, 나눗셈은 비트 쉬프트에 의해 실현됨을 특징으로 하는 역양자화 및 역변환 근사화 구현 방법.
제15항 내지 제19항 중 한 항에 있어서, 상기 근사화는, 역변환 결과가 변환에 대응되도록, 즉 상기 근사화를 포함한 상기 소정 역변환 매트릭스와 상기 근사화를 포함한 상기 소정 역변환 매트릭스의 전치 매트릭스의 곱이 단위(identity) 매트릭스가 되게하는 방식으로 적응됨을 특징으로 하는 역양자화 및 역변환 근사화 구현 방법.
제15항 내지 제20항 중 한 항에 있어서, 상기 소정의 역변환 매트릭스는 이하와 같은 형태의 4x4 매트릭스이고,

이때 a=1/2, b=, c=이고, 상기 'c'는 식 d=c/b에 따라 상기 매트릭스 내에서 대체되고, 상기 소정 역변환 매트릭스는 대각값들인 {a,b,a,b}를 구비하는 대각 매트릭스와 '1'과 'd'의 절대값들을 구비한 성분들만포함하는 단순 역변환 매트릭스로 분해하여 단순화되고, 상기 대각 매트릭스는 상기 소정 역양자화 확장에 사용됨을 특징으로 하는 역양자화 및 역변환 근사화 구현 방법.
제21항에 있어서, 상기 단순 역변환 매트릭스에서 상기 'd' 값은 유리수 7/16에 의해 근사화됨을 특징으로 하는 상기 역양자화 및 역변환 근사화 구현 방법.
제21항에 있어서, 상기 단순 역변환 매트릭스에서 상기 'd' 값은 유리수에 의해 근사화되고, 상기 대각 매트릭스의 상기 'b' 값은 'd'가 상기 유리수일 때 식으로 적응됨을 특징으로 하는 역양자화 및 역변환 근사화 구현 방법.
제21항에 있어서, 상기 단순 역변환 매트릭스에서 상기 'd' 값은 유리수 7/16에 의해 근사화되고, 상기 역변환은 네 개의 값 X[0], X[1], X[2], X[3]들의 1차원 시퀀스로 된 변환에 대해 이하의 식으로 구현되고,

e=X[0]+X[3]

f=X[1]+X[2]

Y[0]=e+f

Y[2]=e-f

e=X[0]-X[3]

f=X[1]-X[2]

Y[1]=e+(f-f/8)/2

Y[3]=(e-e/8)/2-f

상기 Y[0], Y[1], Y[2], Y[3]은 네개의 변환값들로 된 일차원 시퀀스이고, 상기 e 및 f는 보조 변수들임을 특징으로 하는 역양자화 및 역변환 근사화 구현 방법.
제15항 내지 제20항 중 한 항에 있어서, 상기 소정 역변환 매트릭스는 이하의 형태로 된 8x8 매트릭스이고,

상기,,,이고, 상기 'c'는 상기 매트릭스에서 c_b=c/b에 따라 대체되고, 상기 'd'는 상기 매트릭스에서 d_b=d/b에 따라 대체되고, 상기 'e'는 상기 매트릭스에서 e_b=e/b에 따라 대체되고, 상기 'g'는 상기 매트릭스에서 g_b=g/b에 따라 대체되며, 상기 소정 역변환 매트릭스는 대각값들인{a,b,f,b,a,b,f,b}를 구비한 대각 매트릭스와 '1', 'c_b', 'd_b', 'e_b', 및 'g_f'의 절대값들을 구비한 성분들만을 포함하는 단순 역변환 매트릭스로 분해되고, 상기 대각 매트릭스는 상기 소정 역양자화 확장에 사용됨을 특징으로 하는 역양자화 및 역변환 근사화 구현 방법.
제25항에 있어서, 상기 단순 역변환 매트릭스에서 상기 'c_b'는 유리수 15/16에 의해 근사화되고, 상기 'd_b'는 유리수 9/16에 의해 근사화되고, 상기 'e_b'는 유리수 1/4에 의해 근사화되며, 상기 'g_f'는 유리수 7/16에 의해 근사화됨을 특징으로 하는 역양자화 및 역변환 근사화 구현 방법.
제25항에 있어서, 상기 단순 역변환 매트릭스에서 상기 'c_b', 'd_b', 'e_b', 및 'g_f' 값들은 유리수들로 근사화되고, 상기 대각 매트릭스에서 상기 'b' 및 'f' 값들은 'c_b', 'd_b', 'e_b', 및 'g_f'가 상기 유리수들일 때과으로 적응됨을 특징으로 하는 역양자화 및 역변환 근사화 구현 방법.
제15항 내지 제27항 중 한 항에 있어서, 이차원 디지털 데이터에 적용될 이차원 역변환에 있어서, 상기 근사화된 성분들을 가진 상기 단순화된 소정 역변환매트릭스 및 상기 근사화된 성분들을 가진 상기 단순 역변환 매트릭스의 전치 매트릭스가 상기 역변환과, 상기 매트릭스들 모두로부터 제거되어 상기 매트릭스들 모두에서 상기 근사화를 보상하도록 적응된 연산들을 포함하는 상기 확장된 역양자화를 구현할 근거로서 사용됨을 특징으로 하는 역양자화 및 역변환 근사화 구현 방법.
디지털 데이터 압축을 위한 인코더(4)에 있어서,

디지털 데이터에 적용될 때 보다 적은 연산을 필요로 하도록 소정 변환 매트릭스를 단순화함으로써 얻어지는 단순화된 변환 매트릭스를 상기 디지털 데이터에 적용함으로써 디지털 데이터를 변환할 이산 코사인 변환(DCT)을 근사화시키고, 무리수로 이뤄진 단순화된 변환 매트릭스의 성분들을 유리수들로 근사화시키는 변환기(41); 및

상기 변환기(41)의 출력과 연결되고, 상기 단순화된 변환 매트릭스의 상기 성분들을 보상하는 확장된 양자화로 상기 변환된 디지털 데이터를 양자화하는 양자화 수단(42)을 포함함을 특징으로 하는 디지털 데이터 압축 인코더.
제1항 내지 제14항 중 한 항에 따른 방법들의 단계들을 구현하는 수단들을 포함하는 디지털 데이터 압축 인코더.
이산 코사인 변환(DCT) 또는 근사 DCT와, 그에 연속된 양자화에 의해 압축된디지털 데이터를 압축해제하기 위한 디코더(5)에 있어서,

확장된 역양자화로 압축 디지털 데이터를 역양자화시키는 역양자화 수단(52); 및

디지털 데이터에 적용될 때 보다 적은 연산을 필요로 하도록 소정 역변환 매트릭스를 단순화함으로써 얻어지는 단순화된 역변환 매트릭스를 상기 디지털 데이터에 적용함으로써 역양자화된 디지털 데이터를 변환하도록 상기 역양자화 수단(52)의 출력에 연결되어 역이산 코사인 변환(IDCT)을 근사화시키고, 무리수로 이뤄진 단순화된 역변환 매트릭스의 성분들을 유리수들로 근사화시키는 변환기(51)를 구비하고,

상기 역양자화 수단(52)에 의해 적용된 확장된 역양자화는 상기 단순화된 역변환 매트릭스 성분들의 상기 근사화를 보상하는 것임을 특징으로 하는 디코더.
제15항 내지 제28항 중 한 항에 따른 방법의 단계들을 구현하는 수단을 구비하는, 이산 코사인 변환(DCT) 또는 근사 DCT와, 그에 연속된 양자화에 의해 압축된 디지털 데이터를 압축해제하기 위한 디코더(5).