KR20000052771A - 벡터양자화 코드북 발생방법 - Google Patents

벡터양자화 코드북 발생방법 Download PDF

Info

Publication number
KR20000052771A
KR20000052771A KR1019990703579A KR19997003579A KR20000052771A KR 20000052771 A KR20000052771 A KR 20000052771A KR 1019990703579 A KR1019990703579 A KR 1019990703579A KR 19997003579 A KR19997003579 A KR 19997003579A KR 20000052771 A KR20000052771 A KR 20000052771A
Authority
KR
South Korea
Prior art keywords
vectors
codebook
index
data array
space
Prior art date
Application number
KR1019990703579A
Other languages
English (en)
Inventor
코크쇼트윌리암스파울
램버트로버트바돌로매
Original Assignee
에이치. 지. 톰슨
유니버시티 오브 스트라스클라이드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에이치. 지. 톰슨, 유니버시티 오브 스트라스클라이드 filed Critical 에이치. 지. 톰슨
Publication of KR20000052771A publication Critical patent/KR20000052771A/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/94Vector quantisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/008Vector quantisation
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3082Vector coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Mechanical Coupling Of Light Guides (AREA)
  • Ultra Sonic Daignosis Equipment (AREA)
  • Optical Integrated Circuits (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Image Processing (AREA)

Abstract

벡터양자화를 이용하는 데이터 압축시스템은 n차원 공간에서 아주 높은 밀도를 나타내는 점들의 소 집합을 찾아 구성한 코드북 또는 인덱스 테이블들을 이용한다. 상기 공간은 부 공간들로 분할되는데, 이 분할은 모든 부 공간에서의 확률밀도 함수의 적분값들이 거의 동일하게 되게 이루어지고, 그런 후에 각 부 공간의 무게중심이 부 공간의 밀도를 나타낼 수 있게 취해진다. 상기 분할은 n차원 공간을 1차원 부호공간으로 맵핑시킬 수 있게 순차적으로 이루어진다.

Description

벡터양자화 코드북 발생방법{vector quantisation codebook generation method}
대량의 디지털 데이터를 저장 또는 전송하는 경우에는 종종 저장공간을 감소 또는 전송시간을 단축시킬 수 있게 상당한 정도까지 데이터를 압축시킬 수 있게 하는 것이 바람직하다. 이러한 압축의 필요성은 고속 처리가 이루어져야만 하는 데이터의 양이 아주 많게 되는 경향이 있는 디지털 비디오를 처리할 경우(특히, 비디오 전화 통신과 같은 실시간 적용의 경우) 특히 중요하다.
디지털 비디오를 압축시키는데 사용하는 기술들 중 하나는 "벡터 양자화"로서 알려져 있는 것으로서, 이 벡터 양자화에 있어서는 기준 패치(patch)들(일례로 하나이상의 "라이브러리(library)" 또는 "원형(archetypal)" 영상들로부터 취한 비교적 작은 영상부분들)의 코드북을 이용하게 되어 있다. 이러한 기술의 가장 단순한 형태에 따르면 압축할 각 영상을 다수의 영상 패치들로 분할하고, 그 영상 패치들을 화소별로 비교하여 각 영상 패치에 대한 정합(즉, 유사) 기준 패치를 코드북으로부터 선택하게 되어 있다. 선택된 각 기준 패치에 대한 인덱스는 그에 대응하는 영상 패치들의 위치 벡터들(즉, 원 영상에서의 영상 패치들의 위치들)과 함께 저장되고, 이에 따라 상기 영상의 압축 표현을 제공한다. 상기 코드북의 복제가 가능하다면 상기 저장된 코드북 인데스들을 이용하여 요구되는 일련의 기준 패치들을 복원시키고, 상기 복원된 기준 패치들을 저장된 각각의 영상 패치 위치벡터들을 이용하여 영상 프레임에 삽입시킴으로써 원 영상에 대한 근사 영상을 구성할 수 있다. 압축비는 영상으로부터 분할된 영상 패치들의 크기에 대해 함수관계를 갖는다. 즉, 영상 패치의 크기가 커지면 압축비도 커지게 된다.
단순한 벡터양자화기술들의 경우는 코드북으로부터의 각 영상 패치들의 소모적인 검색의 필요성이 있고, 또한 압축된 영상의 화질을 최대화시키기 위해 대규모의 코드북들을 사용하는 경우 그리고 많은 횟수의 화소 비교를 필요로 하는 큰 크기의 패치들을 압축비의 최대화를 위해 발생시키는 경우에는 연산면에서 비용이 많이 드는 과정이 필요하게 된다. 이러한 검색비용의 절감을 위해 사용하는 기술들 중 하나는 "계층적 벡터양자화"(hierarchical vector quantisation: HVQ)로 알려진 것으로서, 이 기술은 IEEE, 1995, pp3-13, "Proceedings of the Data Compression Conference"에서 엔 채다(N Chadda)씨, 엠 비스와나스(M vishwanath)씨, 피 에이 초우(P A Chou)씨의 "Hierarchical Vector Quantization of Perceptually Weighted Block Transforms"에 기재되어 있다.
계층적 벡터양자화를 설명하기 위해서 먼저 흑백 비디오 시퀀스로 디지털화된 프레임들이 각기 바이트 단위의 정수의 형태로 된 세기값을 갖는 화소들의 어레이로 구성되어 있는 경우 그 프레임들을 개별적으로 압축시킬 필요가 있는 것으로 간주하자. 또한, 각 프레임은 각기 한 쌍의 세기값들 또 이차원 벡터[i,j]로 표현되는 수평인접화소들의 쌍들로 형성되는 패치들로 분할되어 있고, 각기 한 쌍의 수평 인접 화소들로 구성되는 다수의 기준 패치들을 포함하는 코드북(B0)이 제공되고, 상기 코드북내의 기준 패치들의 수(일례로, 256)가 가능한 화소쌍 패치들의 전체 수보다 상당히 적게 되어 있는 것으로 가정하자. 또한, 상기 2차원 벡터들의 매 가능한 값들을 관련 코드북 어드레스들로 맵핑(mapping)시키는 인덱스 테이블(T0)을 제공하여 "T0[i,j]"에 의해 코드북(B0)(즉, B0[T0[i,j]])에서 벡터[i,j]에 대한 최근접 엔트리(closest entry)가 어드레스되게 한다. 그러면 주어진 입력 벡터에 대해 코드북에서 최근접 엔트리를 검색하는 것은 단순히 테이블(T0)을 룩업(look-up)하는 것만으로 가능하게 된다.
그러면 압축할 프레임이 각기 [i,j,k,l]의 세기값을 갖는 4차원 벡터로 표현되고 2 x 2 화소로 이루어진 패치들로 재분할(sub-divide)되는 것으로 가정하자. 이 4차원 벡터들의 각각은 두개의 2차원 벡터들로 분할되고, 테이블(T0)들을 사용하여 다른 2차원 벡터[[T0[i,j], [T0[k,l]]로 맵핑될 수 있다. 그리고 일련의 4 화소 패치들에 대응하는 다수의 4차원 벡터들을 포함하는 제 2 코드북(B1)이 제공되는 것으로 가정하자(이 경우에도 상기 패치들의 수가 가능한 4 비트 패치들의 전체 수보다 상당히 적게 되어 있다.) 또한, 제 2 레벨 인덱스 테이블(T1)을 구성하는데, 이는"B1[T1[T0[i,j], [T0[k,l]]]"이 코드북(B1)에서 "[B0[T0[i,j]], B0[T0[k,l]]]"에 대한 최근접 엔트리가 되게 구성한다. 그러면 주어진 입력 벡터에 대해 코드북(B1)에서 최근접 엔트리를 검색하는 것은 화소쌍[i,j], [k,l]에 대해 테이블(T0)을 룩업한 후 결과의 2차원 벡터 T0[i,j], T0[k,l]들을 테이블(T1)에 적용하는 것으로 가능하게 된다. 이 과정은 도 1에 예시되어 있다.
비계층적 벡터양자화의 경우에는 4차원 벡터들을 포함하는 코드북을 제공할 필요성이 있고, 또한 압축할 영상에서의 각 4차원 벡터(또는 패치)에 대한 각 엔트리를 그에 대응하는 코드북에서의 벡터 엔트리와 비교해야 할 필요성이 있다. 이와 같은 소모적인 검색방법은 각 벡터에서의 성분 수가 n이고 코드북에서의 엔트리 수가 m이라 할 때 n x m회의 비교동작을 필요로 한다. 이와는 대조적으로 계층적 벡터양자화의 경우에는 정합 벡터를 찾는데 n-1회의 룩업단계를 필요로 한다. 비교동작과 룩업동작에 대체로 동일한 연산 비용이 소요된다고 하면 상기 "n x m"은 "n-1"에 비해 당연한 값 "m"만큼 아주 크고, 계층적 벡터양자화 룩업 방법이 상기한 소모적인 검색방법보다 거의 m배정도 빠르다는 것을 인지할 수 있을 것이다.
상기 계층적 벡터양자화방법에서 추가되는 인덱스 테이블의 레벨이 증가하면(T2, T3등등), 압축비도 증가한다. 여기서 주지해야할 점은 실제의 경우 계층적 벡터양자화방법을 행함에 있어 중간 코드북들은 필수적이지 않기 때문에 단지 최종 레벨의 코드북(B)만이 보유될 필요가 있다는 점이다.
계층적 벡터양자화방법은 칼라 영상을 압축시키는데도 사용할 수 있는데, 이 경우 압축은 칼라 영상의 3 성분(일례로, 적색, 청색, 녹색)을 분리해내고, 그 분리된 성분들을 개별적으로 압축시킨 후 결과적인 3 세트의 코드북 기준 패치들을 재결합시켜 압축이 해제된 영상을 발생시킬 수 있게 함으로써 이루어진다.
계층적 벡터양자화방법을 효과적으로 사용하기 위해서는 일련의 테이블(T0,1,..,m)들과 일련의 코드북(B0,1,...,m)들을 구성할 필요가 있는 것이 분명할 것이다(여기서, "m"은 압축에 사용되는 최대 크기의 패치에서의 화소 수의 log2값). 이에 관련한 종래의 계층적 벡터양자화방법은 다수의 원형 영상 프레임들로부터 기준패치들을 추출하여 코드북들을 구성한 후 그 코드북들로부터 테이블들을 구하는 것이었다.
최종 레벨 m에서의 패치들의 크기가 레벨 m-1에서의 패치들의 크기의 2배에 해당하기 때문에 인덱스 테이블(Tm)은 레벨 m-1에서의 모든 가능한 패치쌍들을 취하고, 레벨 m에서의 패치들에 대한 코드북에서의 소모적인 검색을 행하여 가장 유사한 레벨 m에서의 패치를 확인할 수 있게 함으로써 구성된다. 그리하여, 만일 레벨 m-1의 패치 7, 13들이 가장 근접하게 위치됐을 때 레벨 m의 패치 100과 유사하다면 TB[7,13]은 100으로 설정될 것이다. 이러한 과정은 각 레벨에서의 코드북과 인덱스 테이블을 발생시킬 수 있게 전 레벨에 걸쳐 전파되게 된다.
상기 방법의 경우, 원형 영상 프레임들로부터 취한 레벨 m의 코드북 패치들의 선택은 본질적으로 임의적이다. 그 결과 이러한 패치들 중 소정의 패치들은 압축될 영상으로부터 정합 패치로서 선택될 수 없거나 아주 간간히 선택되기 때문에 비효과적인 코드북이 구성된다.
본 발명은 벡터양자화 데이터 압축에 관한 것으로, 특히 벡터양자화 데이터압축에 사용하기 위한 코드북(codebook)을 구성하는 방법 및 그에 따라 구성된 코드북에 관한 것이다.
도 1은 2개 층 계층적 벡터양자화 방법을 개략적으로 나타내는 도면.
도 2는 압축용의 2차원 디지털 영상프레임을 나타내는 도면.
도 3은 도 2의 영상 프레임으로부터 얻은 제 1 레벨 빈도 맵을 나타내는 도면.
도 4는 도 3의 빈도 맵을 사용하여 도 2의 영상프레임으로부터 얻은 제 1 레벨 압축 영상프레임을 나타내는 도면.
도 5는 도 4의 영상으로부터 얻은 제 2 레벨 빈도 맵을 나타내는 도면.
도 6은 도 5의 빈도 맵을 사용하여 도 2의 영상프레임으로부터 얻은 제 2 레벨 압축 영상프레임을 나타내는 도면.
본 발명의 목적은 종래의 벡터양자화 코드북들의 단점들을 해소 내지는 최소한 완화시키는 것이다.
본 발명의 다른 목적은 코드북을 구성하는데 사용된 훈련 데이터의 통계적인 특성이 반영된 통계적인 특성을 갖는 데이터를 압축시킬 시 상기 코드북의 엔트리들을 대체로 동일한 빈도로 사용하게 되어 있는 벡터양자화 코드북을 발생시키는 방법을 제공하는 것이다.
본 발명의 제 1 양상에 따르면, 일련의 데이터 값들로 구성된 하나 이상의 원형 데이터 어레이로부터 벡터양자화 코드북을 구성하는 방법에 있어서,
1) 상기 데이터 어레이(들)로부터 각기 그 어레이(들)내에서 인접하는 일련의 데이터 값들로 구성되고 무한의 n차원 공간내에서의 일 지점을 한정하는 다수의 제 1 n차원 샘플 벡터들을 선택하는 단계와;
2) 상기 공간을 각기 실질적으로 동일한 수의 샘플 벡터들을 포함하는 소정 수의 영역들로 분할하는 단계와;
3) 상기 영역들의 각각에 상기 단계 2)에서 행한 분할과정을 코드화할 수 있게 선택된 유일한 인덱스를 할당하는 단계와;
4) 상기 공간내의 실질적으로 모든 가능한 지점들에 대해 그 지점들이 위치되는 영역들을 결정하고, 상기 각 영역 인덱스들로 실질적으로 모든 가능한 지점들을 맵핑시키는 룩업 인덱스 테이블을 구성하는 단계와;
5) 상기 데이터 어레이(들)로부터 각기 일련의 인접 데이터값들로 구성되는 다수의 제 2 n차원 샘플 벡터들을 선택하고, 그 샘플 벡터들의 각각을 또 다른 데이터 어레이 또는 데이터 어레이들을 발생시키도록 상기 단계 4)에서 발생된 인덱스 테이블을 룩업하여 얻은 관련 영역 인덱스로 대체시키는 단계와;
6) 상기 또 다른 데이터 어레이(들) 및 후속적으로 발생되는 모든 또 다른 데이터 어레이(들)에 대해 상기 단계 1) 및 단계 5)를 반복적으로 행하고, 이 때 최종 반복 단계에서 발생된 각 인덱스를 상기 원형 데이터 어레이(들)내의 일련의 nm차원(여기서, m은 행한 반복 횟수) 샘플 벡터들로부터 구하는 단계와;
7) 상기 최종 반복단계에서 발생된 각 인덱스에 대해 상기 원형 데이터 어레이내의 관련된 일련의 nm차원 샘플 벡터들을 나타내는 nm차원 기준 벡터를 발생시키는 단계와;
8) 상기 기준 벡터들을 포함하는 코드북을 상기 최종 반복단계에서 발생된 각 인덱스가 상기 코드북내에서의 대응 기준 벡터의 위치를 나타내게 구성하는 단계를 포함하는 것을 특징으로 하는 벡터양자화 코드북 구성방법이 제공된다.
채택된 방법은 n차원 공간에서 보다 높은 밀도를 나타내는 점들의 소 집합을 찾는 것이다. 효과적인 부호화를 위해서는 이러한 점들 모두들이 높고 동일한 빈도로 사용되어야만 한다. 일례로 n차원 공간내의 균일한 격자에서의 확률 밀도 함수의 부호화된 데이터로 나타내어야 하는 밀도에 관한 소정의 정보가 있다고 가정하자. 이 경우 과제는 다음의 두 단계로 분할할 수 있다.
a) 상기 n차원 공간을 거의 동일한 확률 밀도 함수들의 적분값들을 발생시키는 부 공간들로 분할하는 단계와,
b) 각 부 공간의 무게중심을 찾아 이 무게중심을 사용하여 그 부 공간내의 밀도를 나타내게 하는 단계.
문제는 영상 압축을 위해 사용되는 형태의 높은 차원(16차원이상)의 공간들을 가지고 작업할 시 연산에 어려움이 있다는 것이다. 본 발명의 기본이론은 상기 단계 a)는 낮은 차원(전형적으로 2차원)에서 쉽게 행할 수 있다는 것으로, 이는 n차원에서의 분할 문제를 보다 낮은 차원에서의 일련의 문제들로 분할하는 소정의 방법이 있었다면 과제 전체가 쉽게 될 수 있었을 것이라는 것을 암시하는 것이다. 일례로 2차원 공간에 대해 분할을 행한 결과 원래의 n차원 공간의 2차원 서브매니폴드(sub-manifold)들로부터 자체가 하나의 길이적인(metric) 공간인 1차원 부호공간으로 거리를 거의 보전한 상태로 프로젝션을 행할 수 있다면 대상체를 분할하는 상기의 방법은 가능하게 된다. 그리하여, 상기의 서브매니폴드 감축을 쌍별로 반복 적용하면 일례로 16차원의 길이 공간을 8차원의 길이 코드공간으로 변환할 수 있다. 상기 서브매니폴드감축방법의 반복 적용하게 되면 결국 16차원 공간을 1차원 코드공간으로 맵핑시킬 수 있게 된다.
바람직하게, 상기 단계 1)에서 상기 선택된 벡터들은 상기 데이터 어레이(들)에 대해 실질적으로 균일하게 분포된다. 더욱 바람직하게, 각 데이터값은 하나이상의 벡터 내에 포함된다.
바람직하게, 상기 단계 5)는 상기 데이터 어레이(들)를 상기 다수의 제 2 샘플 벡터들로 각 엔트리가 하나이상의 벡터에 포함되게 재 분할하는 단계를 포함한다. 그러나, 다른 실시예로서, 상기 선택된 벡터들은 상기 다수의 제 1 샘플 벡터들이 후속적으로 선택되게 되는 영역들과 일치하는 데이터 어레이의 부분만을 포함할 수도 있다.
본 발명의 일 실시예에 따르면, 상기 단계 2)는 상기 공간의 각 차원에 대해 벡터들의 분포 평균 및 변화를 결정하는 단계(a)와, 벡터들이 최대 변화를 갖게 되는 차원을 식별하는 단계(b)와, 상기 공간을 2개의 영역들, 즉 상기 식별된 차원에 대해 평균값을 초과하는 값을 갖는 벡터들을 포함하는 제 1 영역과, 그렇지 않은 벡터들을 포함하는 제 2 영역으로 분할하는 단계(c)를 포함한다. 각 영역에 대해, 상기 단계 a) 내지 단계 c)는 요구되는 수의 영역들이 얻어질 때까지 반복 실행된다. 상기 수는 상기 룩업 인덱스 테이블들의 요구되는 크기에 의해 결정된다.
본 발명의 다른 실시예에 따르면, 상기 단계 2)는 상기 공간 내에서의 벡터 분포의 주 성분 (또는 회귀선)을 결정하는 단계와, 그 뒤에 상기 주성분의 중간점을 결정하는 단계와, 그 뒤에 상기 공간을 상기 주 성분에 대해 수직을 이루고 상기 주성분의 중간점을 통과하는 선으로 분할하여 두개의 영역 또는 부 공간들을 발생시키는 단계를 포함한다. 이 영역들의 각각은 다시 상기 과정을 반복 실행하여 요구되는 수의 영역이 얻어질 때까지 분할된다.
비록 상기한 두 분할과정은 동일한 분할단계의 반복 적용을 포함하나, 이것은 본 발명의 필수요건이 아니다. 본 발명의 다른 실시예에 따르면 각 분할과정 시 두개의 다른 분할단계를 대체형식으로 적용할 수 있을 것이다.
상기 분할과정에 의해 발생된 영역들의 수는 전형적으로 1000 내지 4000 미만, 일례로, 128 도는 256이다. 이보다 영역의 수가 많게 되면 처리할 수 없을 정도로 연산이 복잡하게 된다.
바람직하게, 상기 단계 1) 내지 단계 4)의 각 반복을 위해 상기 영역들의 발생 순서가 인덱스들의 할당을 결정하는데 사용된다. 특히(이진 인덱스들에 대해), 상기 제 1 분할에 의해서는 인덱스의 최상위비트가 결정되고, 상기 제 2 분할에 의해서는 다음 최상위비트 등등이 결정된다. 평균값을 초과하는 벡터들을 포함하는 영역에 대해 적당한 비트는 1로 설정되고 평균값이하의 벡터들을 포함하는 영역에 대해 적당한 비트는 0으로 설정된다. 여기서, 1을 0으로 그리고 0을 1로 대체시킨 경우에도 유사한 결과가 얻어질 수 있다는 것을 인지할 수 있을 것이다.
바람직하게, 단계 3)에서 인덱스들의 할당 결과 그 인덱스들은 상기 영역들의 순서를 각 영역의 벡터들을 구성하는 데이터 값들의 평균값에 관련된 상태로 보전하게 된다.
본 발명은 특히 각기 세기값에 의해 한정되는 영상 화소들의 어레이를 포함하는 디지털 영상들을 압축하는데 사용하기 위한 코드북들을 발생시키는데 적용 가능하다. 제 1 레벨의 벡터들은 원형 영상 프레임의 인접 화소들의 패치들을 나타내고, 반면에 보다 높은 레벨의 벡터들은 압축 영상의 패치들에 대응한다. 각 레벨에서 상기 영역들에는 그 영역들의 주 순서를 보전하는 인덱스들이 할당된다. 일례로, 비교적 어두운 패치들을 포함하는 영역들에는 비교적 낮은 값의 인덱스들이 할당되고, 반면에 비교적 밝은 패치들을 포함하는 영역들에는 비교적 높은 값의 인덱스들이 할당된다.
바람직하게, 상기 방법의 단계 1)에서 n = 2 이다. 더욱 바람직하게, 상기 제 1 반복과정에서 상기 원형 데이터 어레이(들)에서 각기 두개의 수평적으로 인접하는 데이터 값들로 이루어지는 데이터값쌍들의 각각이 단계 2)에서 사용하기 위한 벡터들을 제공하도록 선택되고, 이에 따라 실질적으로 모든 데이터값들이 두 데이터값쌍들에서 나타나게 된다. 단계 5)에서는 상기 또는 각 데이터 어레이는 수평적으로 인접하는 데이터값쌍들로 재 분할된다. 여기서, 각 데이터값쌍은 이웃하는 데이터값쌍(들)과 접촉한다. 상기 제 2 반복과정의 경우, 상기 단계 1)에서는 수직적으로 인접하는 두개의 데이터값들로 이루어지는 데이터값쌍들의 각각이 추출되고, 반면에 단계 5)에서는 (만일 상기 과정이 3회 이상의 반복횟수를 포함하는 경우) 상기 또는 각 데이터 어레이는 수직적으로 인접하는 데이터값쌍들로 재 분할된다. 각 후속반복과정을 위해 상기 수평 및 수직 인접 데이터값쌍들은 교대로 선택되게 된다.
비록 상기 다수의 제 1 및 제 2 샘플 벡터들은 모두 동일한 배향을 가지고 있으나, 이는 필수 요건은 아니다. 일례로, 상기 제 1 및 제 2 샘플 벡터들 중 어느 것에서도 수평 및 수직 패치들이 혼합된 상태로 존재할 수 있다.
상기의 방법은 모든 벡터양자화방법에 사용하기 위한 최적의 코드북들을 형성시킬 수 있다. 그러나, 상기 방법은 계층적 벡터양자화를 위해 필요한 각 레벨에 대한 인덱스 룩업 테이블들이 코드북 형성방법의 고유 산물인 경우에는 계층적 벡터양자화 방법에 사용하기 위한 코드북들을 형성시키는데 특히 적합하다.
상기 방법의 소정의 실시예들에 따르면, 각 레벨의 코드북을 발생시킬 수 있도록 각 반복과정의 말기에 단계 7) 및 단계 8)을 추가로 행하는 것이 바람직할 수 있다. 이는 일례로 영상을 크기가변성 기준 벡터들을 사용하여 압축하여야 하는 경우에 필요할 수 있을 것이다.
본 발명의 제 2 양상에 따르면, 일련의 데이터 값들로 구성된 하나 이상의 원형 데이터 어레이로부터 벡터양자화 코드북을 구성하는 방법에 있어서,
1) 상기 데이터 어레이(들)로부터 각기 그 어레이(들)내에서 인접하는 일련의 데이터 값들로 구성되고 무한의 n차원 공간내에서의 일 지점을 한정하는 다수의 제 1 n차원 샘플 벡터들을 선택하는 단계와;
2) 상기 샘플 벡터들을 포함하는 상기 공간을 각기 실질적으로 동일한 수의 샘플 벡터들을 포함하는 소정 수의 영역들로 분할하는 단계와;
3) 상기 영역들의 각각에 상기 단계 2)에서 행한 분할과정을 코드화할 수 있게 선택된 유일한 인덱스를 할당하는 단계와;
4) 상기 공간내의 실질적으로 모든 가능한 지점들에 대해 그 지점들이 위치되는 영역들을 결정하고, 상기 각 영역 인덱스들로 실질적으로 모든 가능한 지점들을 맵핑시키는 룩업 인덱스 테이블을 구성하는 단계와;
5) 각 영역에 대해 그 그룹에서의 샘플 벡터들을 나타내는 기준 벡터를 결정하는 단계와;
6) 상기 기준 벡터들을 포함하는 코드북을 각 인덱스가 상기 코드북 내에서의 대응 기준 벡터의 위치를 나타내게 구성하는 단계를 포함하는 것을 특징으로 하는 벡터양자화 코드북 구성방법이 제공된다.
본 발명의 제 3 양상에 따르면, 일련의 데이터 값들로 구성된 하나 이상의 원형 데이터 어레이로부터 계층적 벡터양자화 방법에 사용하기 위한 일련의 인덱스 테이블들을 구성하는 방법에 있어서,
1) 상기 데이터 어레이(들)로부터 각기 그 어레이(들)내에서 인접하는 일련의 데이터 값들로 구성되고 무한의 n차원 공간 내에서의 일 지점을 한정하는 다수의 제 1 n차원 샘플 벡터들을 선택하는 단계와;
2) 상기 공간을 각각 실질적으로 동일한 수의 샘플 벡터들을 포함하는 소정 수의 영역들로 분할하는 단계와;
3) 상기 영역들의 각각에 상기 단계 2)에서 행한 분할과정을 코드화할 수 있게 선택된 유일한 인덱스를 할당하는 단계와;
4) 상기 공간내의 실질적으로 모든 가능한 지점들에 대해 그 지점들이 위치되는 영역들을 결정하고, 상기 각 영역 인덱스들로 실질적으로 모든 가능한 지점들을 맵핑시키는 룩업 인덱스 테이블을 구성하는 단계와;
5) 상기 데이터 어레이(들)로부터 각기 일련의 인접 데이터값들로 구성되는 다수의 제 2 n차원 샘플 벡터들을 선택하고, 그 샘플 벡터들의 각각을 또 다른 데이터 어레이 또는 데이터 어레이들을 발생시키도록 상기 단계 4)에서 발생된 인덱스 테이블을 룩업하여 얻은 관련 영역 인덱스로 대체시키는 단계와;
6) 상기 또 다른 데이터 어레이(들) 및 후속적으로 발생되는 모든 또 다른 데이터 어레이(들)에 대해 상기 단계 1) 및 단계 5)를 반복적으로 행하고, 이 때 최종 반복 단계에서 발생된 각 인덱스를 상기 원형 데이터 어레이(들)내의 일련의 nm차원(여기서, m은 행한 반복 횟수) 샘플 벡터들로부터 구하는 단계를 포함하는 것을 특징으로 하는 인덱스 테이블 구성방법이 제공된다.
본 발명의 상기 제 3 양상에 따른 방법에 의하면 데이터를 부호화시킬 필요가 있는 경우에, 그러나 부호화된 데이터로부터 원래의 데이터를 재 구성해야할 필요가 없는 경우, 즉 코드북이 불필요한 경우에 사용하기 위한 일련의 인덱스 테이블들을 발생시키는 것이 가능하다.
상기에서 사용한 "원형(archetypal)"이란 용어는 일례로 카메라를 사용하여 포착한 실제 영상을 포함한다. 그러나, 상기 용어는 또한 기 존재하는 코드북들과 같이 인공적으로 발생된 영상도 포함한다.
이하, 본 발명에 대한 보다 명확한 이해를 위해 그리고 본 발명이 어떻게 실시되는가를 나타내기 위해 본 발명을 다음의 첨부 도면을 참고로 하여 설명하겠다:
도 2에는 320 x 200 화소들로 구성되는 2차원의 흑백 디지털 영상이 도시되어 있다. 각 화소의 휘도 레벨 또는 세기는 0 내지 256(즉, 8비트 2진 정수)의 범위 내로 한정된다. 여기서, 도 2의 영상을 계층적 벡터양자화 방법을 이용하여 4의 인수로 압축시키는 것이 필요하다고 가정하자. 이 방법은 도 1에 예시되어 있고, 이미 상술하였다. 먼저 상기 영상을 일정한 2 x 2 화소 영상 패치들로 재 분할한다. 이러한 패치들의 각각을 그 뒤에 상,하 화소쌍들로 분할시킨다. 그 뒤에 각 패치마다 상,하 화소쌍들을 동일한 제 1 레벨 룩업 테이블(T0)들과 평행하게 이동시켜 각 패치에 대한 제 1 레벨 인덱스들을 구한다. 그 뒤에 결과 인덱스쌍들을 제 2 레벨 룩업 테이블(T1)로 이동시켜 코드북 내의 기준 패치를 어드레스시키는 제 2 레벨 인덱스를 구한다. 상기 영상의 압축표현은 단지 상기 영상 내에서의 상기 영상 패치들의 각각의 위치들 및 각 인덱스를 저장함으로써 형성된다. 상기 데이터를 압축을 해제시키기 위해서는 상기 인덱스들을 이용하여 단지 상기 코드북 또는 상기 코드북의 복제본을 억세스하는 것과 결과 기준 패치들을 정확히 배열시키는 것만이 필요하다.
정보이론의 기본 개념에 따르면 동일한 빈도로 압축되어야 하는 영상에서 발생하기 쉬운 패치들만을 포함하는 코드북이 가장 효율적인 코드북이다. 이와는 대조로 영상 압축 시 전혀 또는 거의 사용되지 않는 패치들을 포함하는 코드북은 아주 비효율적일 것이다. 상기에서 언급한 바와 같이 코드북들은 일반적으로 압축할 영상들 중 전형적인 것으로 예상되는 일련의 시험 또는 원형 영상들을 사용하여 발생된다. 따라서, 만일 코드북 내의 패치들이 시험 영상들에서 대체로 동일한 빈도로 발생된다면 이러한 패치들은 압축할 영상에서도 동일한 빈도로 발생하게 될 것이다.
도 2의 영상프레임을 압축시키는데 적합한 2 x 2 화소패치들의 코드북을 구성하는데 있어 제 1 단계는 디지털 원형 영상(이 경우, 도 2의 영상 프레임이 원형 영상으로 간주될 수 있을 것이다)으로부터 각기 수평적으로 인접하는 두개의 화소들로 이루어진 화소쌍들의 각각을 다른 두개의 화소쌍들 내에 상기 영상 프레임의 가장자리에 위치한 화소가 아닌 화소들이 존재하게 추출하는 것이다. 이미 언급한 바와 같이 원형 영상은 압축할 영상들과 유사한 특성을 가지도록 선택된다. 그 뒤에 각 화소쌍의 우측 및 좌측 화소들의 세기들을 2차원 공간에서 상대적으로 작도하여 화소쌍들의 세기분포를 나타내는 제 1 레벨 빈도 맵(또는 발생 맵)을 얻는다. 도 3에는 도 2의 영상에 대한 맵이 도시되어 있는데, 이에 있어 예시의 목적으로 밝은 영역은 유사한 화소쌍들의 고밀도 분포에 대응하며, 반면에 어두운 영역은 유사한 화소쌍들의 저밀도 분포에 대응한다. 전형적인 영상의 경우 인접 화소쌍들은 유사한 세기를 나타내는 경향이 있고(화소쌍이 뚜렷한 가장자리(sharp edge)에 걸쳐있는 경우는 제외), 그 결과 빈도 맵의 좌하부로부터 우상부쪽으로 빈도 맵의 대각선을 교차하여 고 세기 대역이 연장되게 된다.
다음에는 상기 맵의 양 축을 기준으로 세기분포를 결정한다. x축방향의 분포는 x축을 따라 도시된다. 이러한 분포를 참조하면 평균치를 결정할 수 있고, 따라서 각 축방향의 분포 변화를 결정할 수 있다. 그 뒤에 빈도 맵을 최소변화를 갖는 축에 대해 평행하고 타측 축의 평균 세기를 통과하는 분할선(이 경우에는 부호"A"로 표시된 선)에 의해 두개의 영역으로 분할하여, 두개의 새로운 서브맵(sub-map)을 형성시킨다. 명백히 알 수 있는 바와 같이, 상기 두 서브맵들은 모두 대체로 동일한 수의 화소쌍들을 포함할 것이다. 상기의 새로운 서브맵들의 각각을 개별적으로 취한 상태에서(도 3에는 상기 서브맵들 중 하나의 y축방향의 세기분포가 예시되어 있음), 상기 과정을 순환적으로 반복하여 각기 대체로 동일한 수의 화소쌍들을 포함하는 또 다른 빈도 서브맵들(적당한 분할선(B, C, D)들을 따라 분할하여)을 발생시킨다. 상기 과정은 서브맵들 또는 그룹들의 수가 제 1 레벨 코드북에서의 요구되는 엔트리 수, 일례로 256과 동일할 때까지 반복된다.
서브맵발생과정이 진행됨에 따라 분할과정을 코드화할 수 있도록 세브맵들에 인덱스 또는 식별자들이 동적(dynamic)으로 할당되게 된다. 256개의 서브맵들이 발생되어야 하는 경우에는 8비트 이진 인덱스들이 필요하다. 상기 과정에서의 1차 분할에 의해서는 인덱스의 최상위비트가 결정되고, 2차분할에 의해서는 인덱스의 다음 최상위비트가 결정되는 방식으로 비트 결정이 이루어진다. 또한, 일례로 분할선(A)에 의해 수평분할이 이루어지는 경우, 상측 서브맵에 대한 관련 비트는 1로 설정되고, 하측 서브맵에 대한 관련 비트는 0으로 설정된다. 일례로 분할선(D)에 의해 수직분할이 이루어지는 경우에는 우측 서브맵에 대한 관련 비트는 1로 설정되고, 좌측 서브맵에 대한 관련 비트는 0으로 설정된다. 그 결과, 맵들의 주 세기를 보전하려는 경향이 있는 일련의 인덱스들이 얻어진다. 일례로, 도 3의 우측상부에 위치한 서브맵은 높은 세기에 대응하여 가장 높은 인덱스를 갖게 될 것이며, 반면에 좌측하부에 위치한 서브맵은 낮은 세기에 대응하여 가장 낮은 인덱스를 갖게 될 것이다.
서브맵들 또는 그룹들의 각각은 상기 빈도 맵의 한 영역을 포함하며, 전체 공간내의 각 지점은 한 서브맵 내에 있게 된다. 먼저, 상기 공간내의 모든 가능한 지점들을 포함하는 제 1 레벨 룩업 인덱스 테이블(T0)이 발생되는데, 이에 있어 각 지점은 그 지점이 위치되어 있는 서브맵에 대한 인덱스로 맵핑되어 있다. 일례로, 화소세기의 범위가 0 내지 255인 경우 인덱스 테이블(T0)은 256 x 256개의 엔트리들을 포함할 것이다.
그 뒤에 각 서브맵에 대해 그 서브맵을 구성하는 모든 화소쌍들의 좌,우 화소들에 대한 평균세기값들을 얻어 2 x 1 화소기준패치를 발생시킨다. 그 뒤에 이러한 기준패치들을 제 1 레벨 코드북(B0)으로서 저장하는데, 여기서 코드북내에서의 기준패치의 위치는 관련 인덱스에 의해 지정된다.
상기 코드북발생과정의 다음단계는 시험 영상을 각기 수평적으로 인접하는 두개의 화소들로 이루어진 화소쌍들로 재 분할하고, 그 화소쌍들의 각각을 관련 제 1 레벨 인덱스로 대체시키는 것이다. 그 결과, 영상이 도 4에 도시된 바와 같이 좌에서 우로 압축된다. 여기서 주지해야할 점은 상기 인덱스들이 서브맵들의 세기순서를 보전하기 때문에 상기 제 1 레벨 압축 영상은 인식가능한 상태로 유지된다.
다음에는 상기 제 1 레벨 압축 영상으로부터 제 2 레벨 빈도맵을 발생시키는데, 단지 이 때만 각기 수직적으로 인접하는 두개의 화소들로 이루어진 화소쌍들이 모두 추출되고, 추출된 각 화소쌍의 상,하 화소들의 세기들이 상대적으로 작도된다. 이 과정은 도 5에 도시되어 있는데, 도 5에는 또한 맵을 상기한 바와 같은 방식으로 분할했을 때의 결과가 도시되어 있다. 그 뒤에는 인덱스들이 동적으로 할당된다.
인지할 수 있는 바와 같이, 제 1 레벨 압축 영상내의 각 화소는 제 1 레벨 코드북(B0)내의 2 화소 기준패치로 맵핑된 인덱스이고, 따라서 제 2 레벨 빈도맵내의 각 엔트리는 2 x 2 화소 패치에 대응한다. 따라서, 제 2 레벨 빈도맵의 각 맵에 대해 그 맵내의 패치들의 각각으로부터 4개의 화소들에 대한 평균값들을 결정하여 2 x 2 화소 기준패치를 발생시킬 수 있다. 그 뒤에 수직적으로 인접하는 제 1 레벨 인덱스들과 그에 관련된 제 2 레벨 인덱스들의 모든 가능한 조합을 포함하는 제 2 레벨 인덱스 룩업 테이블(T0)을 구성한다. 그런 후에 이러한 기준패치들을 제 2 레벨 코드북으로서 저장하는데, 여기서 코드북내에서의 기준패치의 위치는 관련된 제 2 레벨 인덱스에 의해 지정된다.
만일 2 x 2 화소 코드북 패치들을 사용하여 달성할 수 있는 압축비보다 높은 압축비를 얻어야 한다면 제 3 레벨 코드북(4 x 2 화소패치들), 제 4 레벨 코드북(4 x 4 화소패치들), 등등을 발생시킬 수 있게 상기 과정을 반복적으로 실시할 수 있다.
본 발명의 놀라운 이점은 인덱스 바이트 정수들로부터 최하위 비트(least significant bit: lsb)의 손실을 허용할 수 있는 데이터 어레이의 압축 표현을 제공할 수 있을 것이라는 점이다. 이것은 상기의 인덱스들이 그들에 의해 나타내어지는 코드북 패치들의 주 순서를 보전하기 때문이다. 그리하여, 인덱스 "110010" 및 "110011"에 의해 지정되는 패치들은 유사하게 되는 경향이 있고, 따라서 한 인덱스의 최하위비트에서의 에러로 인해 압축이 해제된 영상에 대한 부 정확한 패치의 선택이 이루어지더라도 상기 영상의 실질적인 왜곡현상은 발생하지 않게 될 것이다. 많은 디지털 전송 시스템들에서는 통상 디지털 데이터의 최상위 비트들에 대해서만 에러정정코드들을 전송하고 있다(일레로, GSM 셀룰라 폰). 따라서, 이러한 전송 시스템들에 의한 전송에는 발명의 방법이 이상적으로 적합하다는 것이 명백할 것이다. 또한, 본 발명에 의한 압축 표현의 오차 허용성에 따라 단지 인덱스들로부터 하나 이상의 최하위비트를 제거하는 것만으로 증가된 압축비를 얻을 수 있게 된다.
상술한 방법은 수평축이나 수직축을 사용하여 각 레벨의 빈도맵을 두개로 반복적으로 분할하는 단계를 포함한다. 상기 분할을 변화가 가장 큰 축을 따라 행함으로써 맵 엔트리들과 새로운 서브맵들의 수단간의 예상 거리를 상기 서브맵들이 변화가 가장 적은 축을 따라 분할했을 경우에서의 예상 거리보다 작게 보장할 수 있다. 이 원리는 2개보다 많은 수의 축들을 따라 변화를 결정하여 더욱 활용할 수 있다. 이를 달성할 수 있는 한 실제 방법은 빈도맵의 주 성분을 계산하는 것이다. 이 방법은 영국, 스트라스클라이드 대학의 디. 테시스(D. Thesis)교수의 "Negative feedback as an organising principle for Artificial Neural Nets"에 기재되어 있다. 이 방법에서는 맵을 주 성분에 대해 직각으로 연장되고 그 성분의 중간지점을 통과하는 선을 따라 분할하고, 각 서브맵에 대해 이 과정을 반복한다.
인지할 수 있는 바와 같이, 본 발명의 범위를 벗어나지 않는 상태에서 상기한 실시예에 대해 여러 수정을 행할 수 있을 것이다. 일례로, 칼라 영상 프레임을 각각의 원색을 개별적으로 고려하여 압축시킬 수도 있을 것이다. 각 칼라에 대해서는 동일한 코드북을 사용할 수도 있을 것이다.
소정의 벡터양자화 방법의 경우에는 평균값과 변화값들이 미리 정규화된 상태에 있는 영상 패치들에 대해 압축을 행하게 되어 있다. 원 영상을 재 구성할 수 있기 위해 코드북 인덱스들이 원래의 패치들의 평균값 및 변화값들과 함께 저장/전송된다. 이러한 방법에 사용하는 코드북들은 정규화된 평균값들 및 변화값들을 가지고 있는 기준 패치들을 포함한다. 이러한 형태의 코드북을 구성할 경우에는 변화가 적은 패치를 전송할 시 그 패치의 평균값에서 전송된 정보의 대부분이 부호화되기 때문에 빈도맵이 변화가 적은 패치들로부터 얻은 엔트리들을 많이 포함하는 경향을 피하게 하는 것이 적합하다. 따라서, 변화가 적은 패치들을 제거할 수 있게 훈련 세트를 전 처리하면 코드북의 구성을 개선시킬 수 있다.
소정의 적용의 경우에는 실제 코드북은 불필요하고 단지 룩업 인덱스 테이블만 구성할 필요성이 있을 수 있다. 일례로, 보안의 목적으로 안면을 인식시킬 필요가 있는 경우를 고려해보자. 이 경우에는 상술한 바와 같이 일련의 인덱스 테이블들을 발생시킨다. 그리고, 계층적 벡터양자화 방법을 이용하여 보안허가자의 안면의 영상을 부호화하는데, 각 영상에 대한 처리결과는 최종 레벨의 인덱스 어레이가 된다. (만일 코드북을 형성한 경우에는 상기 인덱스들은 그 코드북내의 각 패치들을 어드레스시키게 될 것이다.) 이러한 어레이들을 데이터베이스에 저장한다. 누가 보안허가를 요구하면 그의 안면 영상을 획득한 후 계층적 벡터양자화방법을 이용하여 부호화시킨다. 결과 인덱스 어레이를 그 뒤에 데이터베이스에 저장된 것과 비교한다.

Claims (13)

  1. 일련의 데이터 값들로 구성된 하나 이상의 원형 데이터 어레이로부터 벡터양자화 코드북을 구성하는 방법에 있어서,
    1) 상기 데이터 어레이(들)로부터 각기 그 어레이(들)내에서 인접하는 일련의 데이터 값들로 구성되고 무한의 n차원 공간 내에서의 일 지점을 한정하는 다수의 제 1 n차원 샘플 벡터들을 선택하는 단계와;
    2) 상기 공간을 각기 실질적으로 동일한 수의 샘플 벡터들을 포함하는 소정 수의 영역들로 분할하는 단계와;
    3) 상기 영역들의 각각에 상기 단계 2)에서 행한 분할과정을 코드화할 수 있게 선택된 유일한 인덱스를 할당하는 단계와;
    4) 상기 공간내의 실질적으로 모든 가능한 지점들에 대해 그 지점들이 위치되는 영역들을 결정하고, 상기 각 영역 인덱스들로 실질적으로 모든 가능한 지점들을 맵핑시키는 룩업 인덱스 테이블을 구성하는 단계와;
    5) 상기 데이터 어레이(들)로부터 각기 일련의 인접 데이터값들로 구성되는 다수의 제 2 n차원 샘플 벡터들을 선택하고, 그 샘플 벡터들의 각각을 또 다른 데이터 어레이 또는 데이터 어레이들을 발생시키도록 상기 단계 4)에서 발생된 인덱스 테이블을 룩업하여 얻은 관련 영역 인덱스로 대체시키는 단계와;
    6) 상기 또 다른 데이터 어레이(들) 및 후속적으로 발생되는 모든 또 다른 데이터 어레이(들)에 대해 상기 단계 1) 및 단계 5)를 반복적으로 행하고, 이 때 최종 반복 단계에서 발생된 각 인덱스를 상기 원형 데이터 어레이(들)내의 일련의 nm차원(여기서, m은 행한 반복 횟수) 샘플 벡터들로부터 구하는 단계와;
    7) 상기 최종 반복단계에서 발생된 각 인덱스에 대해 상기 원형 데이터 어레이내의 관련된 일련의 nm차원 샘플 벡터들을 나타내는 nm차원 기준 벡터를 발생시키는 단계와;
    8) 상기 기준 벡터들을 포함하는 코드북을 상기 최종 반복단계에서 발생된 각 인덱스가 상기 코드북 내에서의 대응 기준 벡터의 위치를 나타내게 구성하는 단계를 포함하는 것을 특징으로 하는 벡터양자화 코드북 구성방법.
  2. 제 1 항에 있어서,
    상기 단계 1)에서 상기 선택된 벡터들이 상기 데이터 어레이(들)에 대해 실질적으로 균일하게 분포되는 것을 특징으로 하는 벡터양자화 코드북 구성방법.
  3. 제 1 항에 있어서,
    상기 단계 5)는 상기 데이터 어레이(들)를 상기 다수의 제 2 샘플 벡터들로 각 엔트리가 하나이상의 벡터에 포함되게 재 분할하는 단계를 포함하는 것을 특징으로 하는 벡터양자화 코드북 구성방법.
  4. 제 1 항 내지 제 3 항 중 어느 한 항에 있어서,
    상기 단계 2)는 상기 공간의 각 차원에 대해 벡터들의 분포 평균 및 변화를 결정하는 단계(a)와, 벡터들이 최대 변화를 갖게 되는 차원을 식별하는 단계(b)와, 상기 공간을 2개의 영역들, 즉 상기 식별된 차원에 대해 평균값을 초과하는 값을 갖는 벡터들을 포함하는 제 1 영역과, 그렇지 않은 벡터들을 포함하는 제 2 영역으로 분할하는 단계(c)를 포함하는 것을 특징으로 하는 벡터양자화 코드북 구성방법.
  5. 제 1 항 내지 제 3 항에 있어서,
    상기 단계 2)는 상기 공간 내에서의 벡터 분포의 주 성분 (또는 회귀선)을 결정하는 단계와, 그 뒤에 상기 주성분의 중간점을 결정하는 단계와, 그 뒤에 상기 공간을 상기 주 성분에 대해 수직을 이루고 상기 주성분의 중간점을 통과하는 선으로 분할하여 두개의 영역 또는 부 공간들을 발생시키는 단계를 포함하는 것을 특징으로 하는 양자벡터화 코드북 구성방법.
  6. 제 4 항에 있어서,
    대체방법으로, 단계 2)는 상기 공간 내에서의 벡터 분포의 주 성분 (또는 회귀선)을 결정하는 단계와, 그 뒤에 상기 주성분의 중간점을 결정하는 단계와, 그 뒤에 상기 공간을 상기 주 성분에 대해 수직을 이루고 상기 주성분의 중간점을 통과하는 선으로 분할하여 두개의 영역 또는 부 공간들을 발생시키는 단계를 포함하는 것을 특징으로 하는 양자벡터화 코드북 구성방법.
  7. 제 5 항에 있어서,
    대체방법으로, 상기 단계 2)는 상기 공간의 각 차원에 대해 벡터들의 분포 평균 및 변화를 결정하는 단계(a)와, 벡터들이 최대 변화를 갖게 되는 차원을 식별하는 단계(b)와, 상기 공간을 2개의 영역들, 즉 상기 식별된 차원에 대해 평균값을 초과하는 값을 갖는 벡터들을 포함하는 제 1 영역과, 그렇지 않은 벡터들을 포함하는 제 2 영역으로 분할하는 단계(c)를 포함하는 것을 특징으로 하는 벡터양자화 코드북 구성방법.
  8. 제 1 항 내지 제 7 항 중 어느 한 항에 있어서,
    상기 단계 1) 내지 단계 4)의 각 반복을 위해 상기 영역들의 발생 순서가 인덱스들의 할당을 결정하는데 사용되는 것을 특징으로 하는 벡터양자화 코드북 구성방법.
  9. 제 8 항에 있어서,
    이진 인덱스들에 대한 대체방법으로, 상기 제 1 분할에 의해서는 인덱스의 최상위비트가 결정되고, 상기 제 2 분할에 의해서는 다음 최상위비트 등등이 결정되는 것을 특징으로 하는 벡터양자화 코드북 구성방법.
  10. 일련의 데이터 값들로 구성된 하나 이상의 원형 데이터 어레이로부터 벡터양자화 코드북을 구성하는 방법에 있어서,
    1) 상기 데이터 어레이(들)로부터 각기 그 어레이(들)내에서 인접하는 일련의 데이터 값들로 구성되고 무한의 n차원 공간 내에서의 일 지점을 한정하는 다수의 제 1 n차원 샘플 벡터들을 선택하는 단계와;
    2) 상기 샘플 벡터들을 포함하는 상기 공간을 각기 실질적으로 동일한 수의 샘플 벡터들을 포함하는 소정 수의 영역들로 분할하는 단계와;
    3) 상기 영역들의 각각에 상기 단계 2)에서 행한 분할과정을 코드화할 수 있게 선택된 유일한 인덱스를 할당하는 단계와;
    4) 상기 공간내의 실질적으로 모든 가능한 지점들에 대해 그 지점들이 위치되는 영역들을 결정하고, 상기 각 영역 인덱스들로 실질적으로 모든 가능한 지점들을 맵핑시키는 룩업 인덱스 테이블을 구성하는 단계와;
    5) 각 영역에 대해 그 그룹에서의 샘플 벡터들을 나타내는 기준 벡터를 결정하는 단계와;
    6) 상기 기준 벡터들을 포함하는 코드북을 각 인덱스가 상기 코드북 내에서의 대응 기준 벡터의 위치를 나타내게 구성하는 단계를 포함하는 것을 특징으로 하는 벡터양자화 코드북 구성방법.
  11. 일련의 데이터 값들로 구성된 하나 이상의 원형 데이터 어레이로부터 계층적 벡터양자화 방법에 사용하기 위한 일련의 인덱스 테이블들을 구성하는 방법에 있어서,
    1) 상기 데이터 어레이(들)로부터 각기 그 어레이(들)내에서 인접하는 일련의 데이터 값들로 구성되고 무한의 n차원 공간 내에서의 일 지점을 한정하는 다수의 제 1 n차원 샘플 벡터들을 선택하는 단계와;
    2) 상기 공간을 각각 실질적으로 동일한 수의 샘플 벡터들을 포함하는 소정 수의 영역들로 분할하는 단계와;
    3) 상기 영역들의 각각에 상기 단계 2)에서 행한 분할과정을 코드화할 수 있게 선택된 유일한 인덱스를 할당하는 단계와;
    4) 상기 공간내의 실질적으로 모든 가능한 지점들에 대해 그 지점들이 위치되는 영역들을 결정하고, 상기 각 영역 인덱스들로 실질적으로 모든 가능한 지점들을 맵핑시키는 룩업 인덱스 테이블을 구성하는 단계와;
    5) 상기 데이터 어레이(들)로부터 각기 일련의 인접 데이터값들로 구성되는 다수의 제 2 n차원 샘플 벡터들을 선택하고, 그 샘플 벡터들의 각각을 또 다른 데이터 어레이 또는 데이터 어레이들을 발생시키도록 상기 단계 4)에서 발생된 인덱스 테이블을 룩업하여 얻은 관련 영역 인덱스로 대체시키는 단계와;
    6) 상기 또 다른 데이터 어레이(들) 및 후속적으로 발생되는 모든 또 다른 데이터 어레이(들)에 대해 상기 단계 1) 및 단계 5)를 반복적으로 행하고, 이 때 최종 반복 단계에서 발생된 각 인덱스를 상기 원형 데이터 어레이(들)내의 일련의 nm차원(여기서, m은 행한 반복 횟수) 샘플 벡터들로부터 구하는 단계를 포함하는 것을 특징으로 하는 인덱스 테이블 구성방법.
  12. 제 1 항 내지 제 10 항 중 어느 한 항의 방법에 의해 구성된 데이터 비교 코드북.
  13. 제 11 항의 방법에 의해 구성된 일련의 인덱스 테이블.
KR1019990703579A 1996-10-23 1997-10-15 벡터양자화 코드북 발생방법 KR20000052771A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GBGB9622055.3A GB9622055D0 (en) 1996-10-23 1996-10-23 Vector quantisation
GB9622055.3 1996-10-23

Publications (1)

Publication Number Publication Date
KR20000052771A true KR20000052771A (ko) 2000-08-25

Family

ID=10801837

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019990703579A KR20000052771A (ko) 1996-10-23 1997-10-15 벡터양자화 코드북 발생방법

Country Status (10)

Country Link
US (1) US6438268B1 (ko)
EP (1) EP0934662B1 (ko)
JP (1) JP2001505730A (ko)
KR (1) KR20000052771A (ko)
CN (1) CN1238100A (ko)
AT (1) ATE223636T1 (ko)
CA (1) CA2269820A1 (ko)
DE (1) DE69715233D1 (ko)
GB (1) GB9622055D0 (ko)
WO (1) WO1998018262A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100980524B1 (ko) * 2005-12-05 2010-09-06 인텔 코포레이션 통신 장치 내에서 구현되는 방법, 장치, 시스템 및 저장매체

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6941287B1 (en) * 1999-04-30 2005-09-06 E. I. Du Pont De Nemours And Company Distributed hierarchical evolutionary modeling and visualization of empirical data
KR100613106B1 (ko) 1999-09-17 2006-08-17 삼성전자주식회사 나무구조벡터양자화(tsvq)에 기반하는 부호화를 위한 인덱스할당방법
GB0002623D0 (en) * 2000-02-05 2000-03-29 Res Councils Improvements in or relating to data compression
US6711283B1 (en) 2000-05-03 2004-03-23 Aperio Technologies, Inc. Fully automatic rapid microscope slide scanner
US7668362B2 (en) 2000-05-03 2010-02-23 Aperio Technologies, Inc. System and method for assessing virtual slide image quality
US7738688B2 (en) * 2000-05-03 2010-06-15 Aperio Technologies, Inc. System and method for viewing virtual slides
US7518652B2 (en) 2000-05-03 2009-04-14 Aperio Technologies, Inc. Method and apparatus for pre-focus in a linear array based slide scanner
WO2002017538A2 (en) * 2000-08-18 2002-02-28 The Regents Of The University Of California Fixed, variable and adaptive bit rate data source encoding (compression) method
JP4393720B2 (ja) * 2001-01-31 2010-01-06 富士通株式会社 パターン認識装置および方法
US8023563B2 (en) * 2002-10-04 2011-09-20 Stmicroelectronics S.R.L. Method and system for processing signals via perceptive vectorial quantization, computer program product therefor
US7257268B2 (en) * 2003-02-28 2007-08-14 Aperio Technologies, Inc. Systems and methods for image pattern recognition
US7116440B2 (en) 2003-02-28 2006-10-03 Aperio Technologies, Inc. Image processing and analysis framework
US20050201470A1 (en) * 2004-03-12 2005-09-15 John Sievers Intra block walk around refresh for H.264
JP5134365B2 (ja) 2004-05-27 2013-01-30 アペリオ・テクノロジーズ・インコーポレイテッド 三次元仮想スライドを生成しかつ可視化するためのシステム及び方法
ATE464635T1 (de) * 2004-07-23 2010-04-15 Telecom Italia Spa Verfahren zum erzeugen und verwenden eines vektorcodebuchs, verfahren und einrichtung zum komprimieren von daten und verteiltes spracherkennungssystem
WO2006081362A2 (en) 2005-01-27 2006-08-03 Aperio Technologies, Inc Systems and methods for viewing three dimensional virtual slides
US8164622B2 (en) 2005-07-01 2012-04-24 Aperio Technologies, Inc. System and method for single optical axis multi-detector microscope slide scanner
FR2893432B1 (fr) * 2005-11-16 2008-01-04 Atmel Corp Quantificateur de vecteur fonde sur une dichotomie spatiale a n dimensions
TWI323129B (en) * 2006-05-17 2010-04-01 Novatek Microelectronics Corp Block truncation coding (btc) method and apparatus
JP5484048B2 (ja) * 2006-06-30 2014-05-07 アペリオ・テクノロジーズ・インコーポレイテッド Dicomを介した大画像保存および取得方法
US8010555B2 (en) 2006-06-30 2011-08-30 Aperio Technologies, Inc. System and method for managing images over a network
EP2153401B1 (en) 2007-05-04 2016-12-28 Leica Biosystems Imaging, Inc. System and method for quality assurance in pathology
CN101163239B (zh) * 2007-11-28 2010-12-08 天津大学 一种新的矢量量化初始码书的生成方法
CN102132494B (zh) 2008-04-16 2013-10-02 华为技术有限公司 通信方法和通信装置
CN101281750B (zh) * 2008-05-29 2010-12-22 上海交通大学 基于变长分裂表的矢量量化高阶码本扩展编码及解码系统
EP3764085A3 (en) 2008-10-24 2021-03-24 Leica Biosystems Imaging Inc. Whole slide fluorescence scanner
TWI376960B (en) * 2009-07-31 2012-11-11 Univ Nat Pingtung Sci & Tech Codebook generating method for image compression
US8098247B2 (en) * 2009-09-24 2012-01-17 Crucs Holdings, Llc Systems and methods for geometric data compression and encryption
WO2011072211A2 (en) 2009-12-11 2011-06-16 Aperio Technologies, Inc. Improved signal to noise ratio in digital pathology image analysis
US8749408B1 (en) * 2012-12-27 2014-06-10 Mediatek Singapore Pte. Ltd. Methods for simplified MMI VQ based HARQ buffer reduction for LTE
US9710695B2 (en) 2013-03-15 2017-07-18 Sony Corporation Characterizing pathology images with statistical analysis of local neural network responses
CN108027816B (zh) * 2015-10-28 2021-10-26 株式会社东芝 数据管理系统、数据管理方法及记录介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3382796T2 (de) 1982-06-11 1996-03-28 Mitsubishi Electric Corp Vorrichtung zur Zwischenbildkodierung.
US5300931A (en) * 1987-09-04 1994-04-05 Unisys Corporation Memory based vector quantization
US5371544A (en) * 1992-02-07 1994-12-06 At&T Corp. Geometric vector quantization

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100980524B1 (ko) * 2005-12-05 2010-09-06 인텔 코포레이션 통신 장치 내에서 구현되는 방법, 장치, 시스템 및 저장매체

Also Published As

Publication number Publication date
EP0934662A1 (en) 1999-08-11
CA2269820A1 (en) 1998-04-30
JP2001505730A (ja) 2001-04-24
EP0934662B1 (en) 2002-09-04
WO1998018262A1 (en) 1998-04-30
DE69715233D1 (de) 2002-10-10
GB9622055D0 (en) 1996-12-18
US6438268B1 (en) 2002-08-20
ATE223636T1 (de) 2002-09-15
CN1238100A (zh) 1999-12-08

Similar Documents

Publication Publication Date Title
KR20000052771A (ko) 벡터양자화 코드북 발생방법
KR0154739B1 (ko) 프랙탈 영상 압축 장치 및 방법
US6072910A (en) Method and apparatus for coding image information, and method of creating code book
CN108259911A (zh) 一种OLED屏Demura数据无损压缩、解压缩方法
US20030081852A1 (en) Encoding method and arrangement
de Garrido et al. A clustering algorithm for entropy-constrained vector quantizer design with applications in coding image pyramids
US6647143B1 (en) Method and device of compressing digital image data
Omari et al. Image compression based on mapping image fractals to rational numbers
Carrato Image vector quantization using ordered codebooks: Properties and applications
US6400766B1 (en) Method and apparatus for digital video compression using three-dimensional cellular automata transforms
CN115396668A (zh) 点云数据的解码方法、编码方法、装置、存储介质及设备
Ribés et al. Combined Kohonen neural networks and discrete cosine transform method for iterated transformation theory
CN115361559A (zh) 图像编码方法、图像解码方法、装置以及存储介质
Otair et al. Research article lossy image compression by Rounding the Intensity Followed by Dividing (RIFD)
JPH10173538A (ja) ベクトル量子化圧縮を高速化する方法
Agahian et al. Spectral compression using subspace clustering
US7155062B1 (en) System and method for performing pattern matching image compression
Hooda et al. Tree based search algorithm for binary image compression
JP2693557B2 (ja) 符号化装置
KR100613106B1 (ko) 나무구조벡터양자화(tsvq)에 기반하는 부호화를 위한 인덱스할당방법
F Riman et al. Using DCT and Quadtree for Image Compression
Jaseela et al. A new approach to fractal image compression using DBSCAN
Chang et al. Image coding by a neural net classification process
Shortt et al. Iterative and noniterative nonuniform quantisation techniques in digital holography
Kadim et al. Lossless Biometric Signal Compression.

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid