KR100982211B1 - 다중의 속도 애플리케이션에 대한 단일 코드북 벡터 양자화 - Google Patents
다중의 속도 애플리케이션에 대한 단일 코드북 벡터 양자화 Download PDFInfo
- Publication number
- KR100982211B1 KR100982211B1 KR1020087007436A KR20087007436A KR100982211B1 KR 100982211 B1 KR100982211 B1 KR 100982211B1 KR 1020087007436 A KR1020087007436 A KR 1020087007436A KR 20087007436 A KR20087007436 A KR 20087007436A KR 100982211 B1 KR100982211 B1 KR 100982211B1
- Authority
- KR
- South Korea
- Prior art keywords
- codebook
- vectors
- reproduction
- reproduction vectors
- vector
- Prior art date
Links
- 239000013598 vector Substances 0.000 title claims abstract description 795
- 238000013139 quantization Methods 0.000 title claims abstract description 112
- 238000000034 method Methods 0.000 claims abstract description 110
- 238000012549 training Methods 0.000 claims description 113
- 238000003860 storage Methods 0.000 claims description 28
- 230000005540 biological transmission Effects 0.000 claims description 24
- 238000004891 communication Methods 0.000 claims description 23
- 238000011084 recovery Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 7
- 230000003247 decreasing effect Effects 0.000 claims description 3
- 230000008929 regeneration Effects 0.000 claims description 3
- 238000011069 regeneration method Methods 0.000 claims description 3
- 230000021615 conjugation Effects 0.000 claims 1
- 230000015654 memory Effects 0.000 description 26
- 238000012545 processing Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 5
- 238000013507 mapping Methods 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 5
- 230000007423 decrease Effects 0.000 description 4
- 238000009826 distribution Methods 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 210000004392 genitalia Anatomy 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3082—Vector coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0004—Design or structure of the codebook
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0007—Codebook element generation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
Claims (36)
- 벡터들의 N-레벨 양자화를 위한 방법으로서,N은 레벨들의 미리 정의된 최대값인 M보다 작거나 같은 적어도 두 개의 미리 정의된 값들의 집합으로부터 상기 양자화 이전에 선택 가능하며,상기 방법은,N개 재생 (reproduction) 벡터들의 N-레벨 코드북(codebook)으로부터 각 벡터에 대해 재생 벡터를 선택하는 단계로서, 상기 N개 재생 벡터들은, 적어도 2개의 미리 정의된 값들의 상기 집합 내의 각 N에 대해, M개 재생 벡터들의 동일한 접합 코드북 (joint codebook)의 첫 번째 N개 재생 벡터들에 의해 표현되는, 선택 단계;를 포함하는, 벡터들의 N-레벨 양자화 방법.
- 제1항에 있어서,n, m이 정수값일 때에 N=2n 그리고 M=2m 을 유지하는, 벡터들의 N-레벨 양자화 방법.
- 제1항 또는 제2항에 있어서,상기 N-레벨의 코드북의 각 재생 벡터는 n 비트 이진 워드에 의해 식별되는, 벡터들의 N-레벨 양자화 방법.
- 제1항에 있어서,상기 벡터들은 데이터 시퀀스의 선형 예측 부호화(Linear Predictive Coding)에 관련된 파라미터들을 포함하는, 벡터들의 N-레벨 양자화 방법.
- 제1항에 있어서,상기 선택 단계는 휴대용 통신 기기에 의해 실행되는, 벡터들의 N-레벨 양자화 방법.
- 벡터들의 N-레벨 양자화를 위한 장치로서,N은 레벨들의 미리 정의된 최대값인 M보다 작거나 같은 적어도 두 개의 미리 정의된 값들의 집합으로부터 상기 양자화 이전에 선택 가능하며,상기 장치는N개 재생 (reproduction) 벡터들의 N-레벨 코드북(codebook)으로부터 각 벡터에 대해 재생 벡터를 선택하는 수단으로서, 상기 N개 재생 벡터들은, 적어도 2개의 미리 정의된 값들의 상기 집합 내의 각 N에 대해, M개 재생 벡터들의 동일한 접합 코드북 (joint codebook)의 첫 번째 N개 재생 벡터들에 의해 표현되는, 수단;을 포함하는, 벡터들의 N-레벨 양자화 장치.
- 제6항에 있어서,상기 장치는 휴대용 통신 기기인, 벡터들의 N-레벨 양자화 장치.
- 벡터들의 N-레벨 양자화를 위해 구체화된 컴퓨터 프로그램을 구비한, 컴퓨터로 읽을 수 있는 저장 매체를 포함하며,N은 레벨들의 미리 정의된 최대값인 M보다 작거나 같은 적어도 두 개의 미리 정의된 값들의 집합으로부터 상기 양자화 이전에 선택 가능할 때에,상기 컴퓨터 프로그램은,N개 재생 (reproduction) 벡터들의 N-레벨 코드북(codebook)으로부터 각 벡터에 대해 재생 벡터를 선택하는 프로그램 코드로서, 상기 N개 재생 벡터들은, 적어도 2개의 미리 정의된 값들의 상기 집합 내의 각 N에 대해, M개 재생 벡터들의 동일한 접합 코드북 (joint codebook)의 첫 번째 N개 재생 벡터들에 의해 표현되는, 프로그램 코드;를 포함하는, 컴퓨터로 읽을 수 있는 저장 매체.
- N-레벨 양자화되었던 벡터들에 대한 재생 벡터들을 회수하기 위한 방법으로서,N은 레벨들의 미리 정의된 최대값인 M보다 작거나 같은 적어도 두 개의 미리 정의된 값들의 집합으로부터 상기 양자화 이전에 선택 가능할 때에,상기 방법은,상기 양자화에서 벡터에 대해 선택되었던 재생 백터의 식별자를 수신하는 단 계; 및상기 식별자를 기반으로, N개 재생 (reproduction) 벡터들의 N-레벨 코드북(codebook)으로부터 상기 재생 벡터를 회수하며, 상기 N개 재생 벡터들은, 적어도 2개의 미리 정의된 값들의 상기 집합 내의 각 N에 대해, M개 재생 (reproduction) 벡터들의 동일한 접합 코드북 (joint codebook)의 첫 번째 N개 재생 벡터들에 의해 표현되는. 회수 단계;를 포함하는, 재생 벡터 회수 방법.
- N-레벨 양자화되었던 벡터들에 대한 재생 벡터들을 회수하기 (retrieving) 위한 장치로서,N은 레벨들의 미리 정의된 최대값인 M보다 작거나 같은 적어도 두 개의 미리 정의된 값들의 집합으로부터 상기 양자화 이전에 선택 가능할 때에,상기 장치는,상기 양자화에서 벡터에 대해 선택되었던 재생 백터의 식별자를 수신하는 수단; 및상기 식별자를 기반으로, N개 재생 (reproduction) 벡터들의 N-레벨 코드북(codebook)으로부터 상기 재생 벡터를 회수하는 수단으로서, 상기 N개 재생 벡터들은, 적어도 2개의 미리 정의된 값들의 상기 집합 내의 각 N에 대해, M개 재생 (reproduction) 벡터들의 동일한 접합 코드북 (joint codebook)의 첫 번째 N개 재생 벡터들에 의해 표현되는, 회수 수단;을 포함하는, 재생 벡터 회수 장치.
- N-레벨 양자화되었던 벡터들에 대한 재생 벡터들을 회수하는 것이 구체화된 컴퓨터 프로그램을 구비하는, 컴퓨터로 읽을 수 있는 저장 매체로서,N은 레벨들의 미리 정의된 최대값인 M보다 작거나 같은 적어도 두 개의 미리 정의된 값들의 집합으로부터 상기 양자화 이전에 선택 가능할 때에,상기 컴퓨터 프로그램은,상기 양자화에서 벡터에 대해 선택되었던 재생 벡터의 식별자를 수신하는 프로그램 코드; 및상기 식별자를 기반으로, N개 재생 (reproduction) 벡터들의 N-레벨 코드북(codebook)으로부터 상기 재생 벡터를 회수하는 프로그램 코드로서, 상기 N개 재생 벡터들은, 적어도 2개의 미리 정의된 값들의 상기 집합 내의 각 N에 대해, M개 재생 (reproduction) 벡터들의 동일한 접합 코드북 (joint codebook)의 첫 번째 N개 재생 벡터들에 의해 표현되는, 프로그램 코드;를 포함하는, 컴퓨터로 읽을 수 있는 저장 매체.
- 벡터들의 표현들을 전송하는 시스템으로서,N개 재생 벡터들의 N-레벨 코드북으로부터 각 벡터에 대한 재생 벡터를 선택하는 수단으로, N은 레벨들의 미리 정의된 최대값인 M보다 작거나 같은 적어도 두 개의 미리 정의된 값들의 집합으로부터 선택하기 이전에 선택 가능하며, 상기 N개 재생 벡터들은 적어도 2개의 미리 정의된 값들의 상기 집합 내의 각 N에 대해, M개 재생 벡터들의 동일한 제1 접합 코드북 (joint codebook)의 첫 번째 N개 재생 벡터들에 의해 표현되는, 선택 수단;상기 선택된 재생 벡터의 식별자를 전송 채널을 경유하여 전송하는 수단;상기 식별자를 수신하는 수단; 및상기 제1 접합 코드북과 동등한 M개 재생 벡터들의 제2 접합 코드북의 첫 번째 N개 재생 벡터들에 의해 표시되는 N개 재생 벡터들의 N-레벨 코드북으로부터, 상기 식별자를 기반으로, 상기 재생 벡터를 회수하는 수단;을 포함하는 전송 시스템.
- 벡터들의 N-레벨 양자화에서 사용하기 위한 M개 재생 벡터들의 접합 코드북을 결정하는 방법으로서,M은 레벨들의 미리 정의된 최대값이며, N은 M보다 작거나 같은 적어도 두 개의 미리 정의된 값들의 집합으로부터 상기 양자화 이전에 선택 가능하며, 상기 양자화에서, 각 벡터에 대한 재생 벡터는, 적어도 2개의 미리 정의된 값들의 상기 집합 내의 각 N에 대해, 상기 접합 코드북의 첫 번째 N개 재생 벡터들에 의해 표현되는 N개 재생 벡터들의 N-레벨 코드북으로부터 선택될 때에,상기 방법은,적어도 부분적으로 복수의 트레이닝 (training) 벡터들을 기반으로 하는 트레이닝 알고리즘에 의해 상기 재생 벡터들을 생성하는 단계; 및상기 생성된 재생 벡터들을 배열 알고리즘에 따라서 상기 접합 코드북 내에 배열하는 단계로서, 각 N에 대해, 상기 접합 코드북 내의 상기 첫 번째 N개 재생 벡터들이 N-레벨 코드북을 형성하여 상기 벡터들의 상기 양자화에 사용될 때에 상기 벡터들의 평균 왜곡(average distortion)이 작아지도록 하는, 배열 단계;를 포함하는, 접합 코드북 결정 방법.
- 제13항에 있어서,n, m이 정수값일 때에 N=2n 그리고 M=2m 을 유지하는, 접합 코드북 결정 방법.
- 제14항에 있어서,상기 트레이닝 알고리즘에 의해 M개 재생 벡터들의 초기 코드북을 생성하는 단계;상기 트레이닝 알고리즘에 의해 2개 재생 벡터들의 2-레벨 코드북을 생성하는 단계;상기 2-레벨 코드북 내의 상기 2개 재생 벡터들과 가장 유사한 2개의 재생 벡터들을 상기 초기 코드북으로부터 선택하는 단계;상기 2개의 선택된 재생 벡터들을 상기 초기 코드북으로부터 상기 접합 코드북 내의 첫 번째 2개의 위치로 복사하고 상기 초기 코드북으로부터 상기 2개의 선택된 재생 벡터들을 삭제하는 단계; 및1 < i ≤ m 인 동안:(a) 상기 트레이닝 알고리즘에 의해 I=2i 개 재생 벡터들의 I-레벨 코드북을 생성하는 단계;(b) 상기 접합 코드북으로 이미 복사된 I/2 개 재생 벡터들과 가장 유사한 I/2 개의 재생 벡터들을 상기 초기 코드북으로부터 식별하는 단계;(c) 상기 I-레벨 코드북 내의 남아있는 식별되지-않은 I/2 개의 재생 벡터들에 대해, 상기 남아있는 식별되지-않은 I/2 재생 벡터들과 가장 유사한 I/2 개의 재생 벡터들을 상기 초기 코드북으로부터 선택하는 단계; 및(d) 상기 I/2 개의 선택된 재생 벡터들을 상기 초기 코드북으로부터 상기 접합 코드북 내의 다음 빈 위치의 증가하는 자리로 복사하고 상기 I/2 개의 선택된 재생 벡터들을 상기 초기 코드북으로부터 삭제하는 단계;인상기 (a) 내지 (d) 를 반복하는 단계;를 포함하는, 접합 코드북 결정 방법.
- 제14항에 있어서,상기 트레이닝 알고리즘에 의해 2개의 재생 벡터들의 2-레벨 코드북을 생성하는 단계;상기 2개의 재생 벡터들을 상기 2-레벨 코드북으로부터 상기 접합 코드북 내의 첫 번째 2개 위치로 복사하는 단계; 및1 < i ≤ m 인 동안:(a) 상기 트레이닝 알고리즘에 의해 I=2i 개 재생 벡터들의 I-레벨 코드북을 생성하는 단계로서, 상기 트레이닝 알고리즘에서, 상기 접합 코드북으로 이미 복사된 I/2 개의 재생 벡터들은 I 개의 재생 벡터들의 코드북의 첫 번째 부분을 형성하며, 그 첫 번째 부분은 상기 트레이닝 알고리즘에 의해 생성된 상기 I-레벨 코드북의 초기값으로서 동작하고 상기 트레이닝 알고리즘 동안 내내 고정된 것으로 간주되는, 생성 단계; 및(b) 상기 생성된 I-레벨 코드북의 I/2개의 마지막 재생 벡터들을 상기 접합 코드북 내의 다음 빈 I/2개의 위치의 증가하는 자리로 복사하는 단계;인상기 (a) 내지 (b)를 반복하는 단계;를 포함하는, 접합 코드북 결정 방법.
- 제13항에 있어서,복수의 트레이닝 벡터들을 기반으로 상기 트레이닝 알고리즘에 의해 M개의 재생 벡터들의 초기 코드북을 생성하는 단계;상기 초기 코드북으로부터, 서로 가장 차이가 나는 두 개의 재생 벡터들을 선택하는 단계;상기 두 개의 선택된 재생 벡터들을 상기 초기 코드북으로부터 상기 접합 코드북 내의 첫 번째 두 개의 위치로 복사하고 상기 초기 코드북으로부터 상기 두 개의 선택된 재생 벡터들을 삭제하는 단계; 및상기 초기 코드북이 비어있지 않을 때까지:(a) 이미 상기 접합 코드북으로 복사된 모든 재생 벡터들에 대해 가장 차이가 나는 재생 벡터를 상기 초기 코드북으로부터 선택하는 단계; 및(b) 상기 선택된 재생 벡터를 상기 초기 코드북으로부터 상기 접합 코드북 내의 다음 빈 위치의 증가하는 자리로 복사하고 상기 초기 코드북으로부터 상기 선택된 재생 벡터를 삭제하는 단계;인상기 (a) 내지 (b)를 반복하는 단계;를 포함하는, 접합 코드북 결정 방법.
- 제13항에 있어서,복수의 트레이닝 벡터들을 기반으로 상기 트레이닝 알고리즘에 의해 M개의 재생 벡터들의 초기 코드북을 생성하는 단계;상기 초기 코드북으로부터, 상기 트레이닝 벡터들의 모두와 가장 유사한 재생 벡터를 선택하는 단계;상기 선택된 재생 벡터들을 상기 초기 코드북으로부터 상기 접합 코드북 내의 첫 번째의 위치로 복사하고 상기 초기 코드북으로부터 상기 선택된 재생 벡터들을 삭제하는 단계; 및상기 초기 코드북이 비어있지 않을 때까지:(a) 이미 상기 접합 코드북으로 복사된 모든 재생 벡터들에 대해 가장 차이가 나는 재생 벡터를 상기 초기 코드북으로부터 선택하는 단계; 및(b) 상기 선택된 재생 벡터를 상기 초기 코드북으로부터 상기 접합 코드북 내의 다음 빈 위치의 증가하는 자리로 복사하고 상기 초기 코드북으로부터 상기 선택된 재생 벡터들을 삭제하는 단계;인상기 (a) 내지 (b)를 반복하는 단계;를 포함하는, 접합 코드북 결정 방법.
- 제13항에 있어서,상기 트레이닝 알고리즘에 의해 M개의 재생 벡터들의 초기 코드북을 생성하는 단계; 및상기 초기 코드북이 비어있지 않을 때까지 다음의:(a) 상기 초기 코드북으로부터 서로 가장 유사한 두 개의 재생 벡터들을 선택하는 단계; 및(b) 상기 선택된 두 개의 재생 벡터를 상기 초기 코드북으로부터 상기 접합 코드북 내의 다음의 빈 위치로, 마지막 위치로부터 감소하는 자리로, 복사하고 상기 초기 코드북으로부터 상기 선택된 두 개의 재생 벡터들을 삭제하는 단계;인상기 (a) 내지 (b)를 반복하는 단계;를 포함하는, 접합 코드북 결정 방법.
- 제13항에 있어서,M보다 작거나 같은 N에 대한, 적어도 두 개의 미리 정의된 값들의 상기 집합이 K 개의 값들인 Ni (i= 1, ..., K)를 포함하고, j = 2,..., K 에 대해 Nj-1 < Nj ≤ M 일 때에,상기 방법은,복수의 트레이닝 벡터들을 기반으로 상기 트레이닝 알고리즘에 의해 M개의 재생 벡터들의 초기 코드북을 생성하는 단계;상기 초기 코드북으로부터 Ni 개의 재생 벡터들을 선택하여, 상기 선택된 재생 벡터들을 포함하는 코드북의 상기 트레이닝 벡터들 모두에 대한 왜곡이 최소가 되도록 하는 단계;상기 선택된 재생 벡터들을 상기 초기 코드북으로부터 상기 접합 코드북으로 복사하고 상기 선택된 재생 벡터들을 상기 초기 코드북으로부터 삭제하는 단계; 및1 < i ≤ K 인 각 Ni 에 대해:(a) 상기 초기 코드북으로부터 Ni - Ni-1 개의 재생 벡터들을 선택하여 상기 접합 코드북으로 복사된 Ni-1 개의 재생 벡터들 및 상기 선택된 재생 벡터들을 포함하는 코드북의 상기 트레이닝 벡터들의 모두에 대한 왜곡이 최소가 되도록 하는 단계; 및(b) 상기 선택된 재생 벡터들을 상기 초기 코드북으로부터 상기 접합 코드북 내의 다음 빈 위치의 증가하는 자리로 복사하고 상기 선택된 재생 벡터들을 상기 초기 코드북으로부터 삭제하는 단계;인상기 (a) 내지 (b)를 반복하는 단계;를 포함하는, 접합 코드북 결정 방법.
- 벡터들의 N-레벨 양자화에서 사용하기 위한 M개 재생 벡터들의 접합 코드북(joint codebook)을 결정하는 장치로서,M은 레벨들의 미리 정의된 최대값이며, N은 M보다 작거나 같은 적어도 두 개의 미리 정의된 값들의 집합으로부터 상기 양자화 이전에 선택 가능하며, 상기 양자화에서, 각 벡터에 대한 재생 벡터는, 적어도 2개의 미리 정의된 값들의 상기 집합 내의 각 N에 대해, 상기 접합 코드북의 첫 번째 N개 재생 벡터들에 의해 표현되는 N개 재생 벡터들의 N-레벨 코드북으로부터 선택될 때에,상기 장치는,적어도 부분적으로 복수의 트레이닝 (training) 벡터들을 기반으로 하는 트레이닝 알고리즘에 의해 상기 재생 벡터들을 생성하는 수단; 및상기 생성된 재생 벡터들을 배열 알고리즘에 따라서 상기 접합 코드북 내에 배열하여, 각 N에 대해, 상기 접합 코드북 내의 상기 첫 번째 N개 재생 벡터들이 N-레벨 코드북을 형성하여 상기 벡터들의 상기 양자화에 사용될 때에 상기 벡터들의 평균 왜곡(average distortion)이 작아지도록 하는, 배열 수단;을 포함하는, 접합 코드북 결정 장치.
- 벡터들의 N-레벨 양자화에서 사용하기 위한 M개 재생 벡터들의 접합 코드북을 결정하는 것이 구체화된 컴퓨터 프로그램을 구비하는, 컴퓨터로 읽을 수 있는 저장 매체로서,M은 레벨들의 미리 정의된 최대값이며, N은 M보다 작거나 같은 적어도 두 개의 미리 정의된 값들의 집합으로부터 상기 양자화 이전에 선택 가능하며, 상기 양자화에서, 각 벡터에 대한 재생 벡터는, 적어도 2개의 미리 정의된 값들의 상기 집합 내의 각 N에 대해, 상기 접합 코드북의 첫 번째 N개 재생 벡터들에 의해 표현되는 N개 재생 벡터들의 N-레벨 코드북으로부터 선택될 때에,상기 컴퓨터 프로그램은,적어도 부분적으로 복수의 트레이닝 (training) 벡터들을 기반으로 하는 트레이닝 알고리즘에 의해 상기 재생 벡터들을 생성하는 프로그램 코드; 및상기 생성된 재생 벡터들을 배열 알고리즘에 따라서 상기 접합 코드북 내에 배열하여, 각 N에 대해, 상기 접합 코드북 내의 상기 첫 번째 N개 재생 벡터들이 N-레벨 코드북을 형성하여 상기 벡터들의 상기 양자화에 사용될 때에 상기 벡터들의 평균 왜곡(average distortion)이 작아지도록 하는, 프로그램 코드;를 포함하는 컴퓨터로 읽을 수 있는 저장 매체.
- 삭제
- 제6항에 있어서,n, m이 정수값일 때에 N=2n 그리고 M=2m 을 유지하는, 벡터들의 N-레벨 양자화 장치.
- 제6항 또는 제24항에 있어서,상기 N-레벨의 코드북의 각 재생 벡터는 n 비트 이진 워드에 의해 식별되는, 벡터들의 N-레벨 양자화 장치.
- 제9항에 있어서,n, m이 정수값일 때에 N=2n 그리고 M=2m 을 유지하는, 재생 벡터 회수 방법.
- 제9항 또는 제26항에 있어서,상기 N-레벨의 코드북의 각 재생 벡터는 n 비트 이진 워드에 의해 식별되는, 재생 벡터 회수 방법.
- 제10항에 있어서,n, m이 정수값일 때에 N=2n 그리고 M=2m 을 유지하는, 재생 벡터 회수 장치.
- 제10항 또는 제28항에 있어서,상기 N-레벨의 코드북의 각 재생 벡터는 n 비트 이진 워드에 의해 식별되는, 재생 벡터 회수 장치.
- 제21항에 있어서,n, m이 정수값일 때에 N=2n 그리고 M=2m 을 유지하는, 접합 코드북 결정 장치.
- 제30항에 있어서, 상기 장치는,상기 트레이닝 알고리즘에 의해 M개 재생 벡터들의 초기 코드북을 생성하는 수단;상기 트레이닝 알고리즘에 의해 2개 재생 벡터들의 2-레벨 코드북을 생성하는 수단;상기 2-레벨 코드북 내의 상기 2개 재생 벡터들과 가장 유사한 2개의 재생 벡터들을 상기 초기 코드북으로부터 선택하는 수단;상기 2개의 선택된 재생 벡터들을 상기 초기 코드북으로부터 상기 접합 코드북 내의 첫 번째 2개의 위치로 복사하고 상기 초기 코드북으로부터 상기 2개의 선택된 재생 벡터들을 삭제하는 수단; 및1 < i ≤ m 인 동안:(a) 상기 트레이닝 알고리즘에 의해 I=2i 개 재생 벡터들의 I-레벨 코드북을 생성하는 단계;(b) 상기 접합 코드북으로 이미 복사된 I/2 개 재생 벡터들과 가장 유사한 I/2 개의 재생 벡터들을 상기 초기 코드북으로부터 식별하는 단계;(c) 상기 I-레벨 코드북 내의 남아있는 식별되지-않은 I/2 개의 재생 벡터들에 대해, 상기 남아있는 식별되지-않은 I/2 재생 벡터들과 가장 유사한 I/2 개의 재생 벡터들을 상기 초기 코드북으로부터 선택하는 단계; 및(d) 상기 I/2 개의 선택된 재생 벡터들을 상기 초기 코드북으로부터 상기 접합 코드북 내의 다음 빈 위치의 증가하는 자리로 복사하고 상기 I/2 개의 선택된 재생 벡터들을 상기 초기 코드북으로부터 삭제하는 단계;인,상기 (a) 내지 (d) 단계를 반복하는 수단;을 포함하는, 접합 코드북 결정 장치.
- 제30항에 있어서, 상기 장치는,상기 트레이닝 알고리즘에 의해 2개의 재생 벡터들의 2-레벨 코드북을 생성하는 수단;상기 2개의 재생 벡터들을 상기 2-레벨 코드북으로부터 상기 접합 코드북 내의 첫 번째 2개 위치로 복사하는 수단; 및1 < i ≤ m 인 동안:(a) 상기 트레이닝 알고리즘에 의해 I=2i 개 재생 벡터들의 I-레벨 코드북을 생성하는 단계로서, 상기 트레이닝 알고리즘에서, 상기 접합 코드북으로 이미 복사된 I/2 개의 재생 벡터들은 I 개의 재생 벡터들의 코드북의 첫 번째 부분을 형성하며, 그 첫 번째 부분은 상기 트레이닝 알고리즘에 의해 생성된 상기 I-레벨 코드북의 초기값으로서 동작하고 상기 트레이닝 알고리즘 동안 내내 고정된 것으로 간주되는, 생성 단계; 및(b) 상기 생성된 I-레벨 코드북의 I/2개의 마지막 재생 벡터들을 상기 접합 코드북 내의 다음 빈 I/2개의 위치의 증가하는 자리로 복사하는 단계;인상기 (a) 내지 (b)를 반복하는 수단;을 포함하는, 접합 코드북 결정 장치.
- 제21항에 있어서, 상기 장치는,복수의 트레이닝 벡터들을 기반으로 상기 트레이닝 알고리즘에 의해 M개의 재생 벡터들의 초기 코드북을 생성하는 수단;상기 초기 코드북으로부터, 서로 가장 차이가 나는 두 개의 재생 벡터들을 선택하는 수단;상기 두 개의 선택된 재생 벡터들을 상기 초기 코드북으로부터 상기 접합 코드북 내의 첫 번째 두 개의 위치로 복사하고 상기 초기 코드북으로부터 상기 두 개의 선택된 재생 벡터들을 삭제하는 수단; 및상기 초기 코드북이 비어있지 않을 때까지:(a) 이미 상기 접합 코드북으로 복사된 모든 재생 벡터들에 대해 가장 차이가 나는 재생 벡터를 상기 초기 코드북으로부터 선택하는 단계; 및(b) 상기 선택된 재생 벡터를 상기 초기 코드북으로부터 상기 접합 코드북 내의 다음 빈 위치의 증가하는 자리로 복사하고 상기 초기 코드북으로부터 상기 선택된 재생 벡터를 삭제하는 단계;인상기 (a) 내지 (b)를 반복하는 수단;을 포함하는, 접합 코드북 결정 장치.
- 제21항에 있어서, 상기 장치는,복수의 트레이닝 벡터들을 기반으로 상기 트레이닝 알고리즘에 의해 M개의 재생 벡터들의 초기 코드북을 생성하는 수단;상기 초기 코드북으로부터, 상기 트레이닝 벡터들의 모두와 가장 유사한 재생 벡터를 선택하는 수단;상기 선택된 재생 벡터들을 상기 초기 코드북으로부터 상기 접합 코드북 내의 첫 번째의 위치로 복사하고 상기 초기 코드북으로부터 상기 선택된 재생 벡터들을 삭제하는 수단; 및상기 초기 코드북이 비어있지 않을 때까지:(a) 이미 상기 접합 코드북으로 복사된 모든 재생 벡터들에 대해 가장 차이가 나는 재생 벡터를 상기 초기 코드북으로부터 선택하는 단계; 및(b) 상기 선택된 재생 벡터를 상기 초기 코드북으로부터 상기 접합 코드북 내의 다음 빈 위치의 증가하는 자리로 복사하고 상기 초기 코드북으로부터 상기 선택된 재생 벡터들을 삭제하는 단계;인상기 (a) 내지 (b)를 반복하는 수단;을 포함하는, 접합 코드북 결정 장치.
- 제21항에 있어서, 상기 장치는,상기 트레이닝 알고리즘에 의해 M개의 재생 벡터들의 초기 코드북을 생성하는 수단; 및상기 초기 코드북이 비어있지 않을 때까지:(a) 상기 초기 코드북으로부터 서로 가장 유사한 두 개의 재생 벡터들을 선택하는 단계; 및(b) 상기 선택된 두 개의 재생 벡터를 상기 초기 코드북으로부터 상기 접합 코드북 내의 다음의 빈 위치로, 마지막 위치로부터 감소하는 자리로, 복사하고 상기 초기 코드북으로부터 상기 선택된 두 개의 재생 벡터들을 삭제하는 단계;인상기 (a) 내지 (b)를 반복하는 수단;을 포함하는, 접합 코드북 결정 장치.
- 제21항에 있어서,M보다 작거나 같은 N에 대한, 적어도 두 개의 미리 정의된 값들의 상기 집합이 K 개의 값들인 Ni (i= 1, ..., K)를 포함하고, j = 2,..., K 에 대해 Nj-1 < Nj ≤ M 일 때에,상기 장치는,복수의 트레이닝 벡터들을 기반으로 상기 트레이닝 알고리즘에 의해 M개의 재생 벡터들의 초기 코드북을 생성하는 수단;상기 초기 코드북으로부터 Ni 개의 재생 벡터들을 선택하여, 상기 선택된 재생 벡터들을 포함하는 코드북의 상기 트레이닝 벡터들 모두에 대한 왜곡이 최소가 되도록 하는 수단;상기 선택된 재생 벡터들을 상기 초기 코드북으로부터 상기 접합 코드북으로 복사하고 상기 선택된 재생 벡터들을 상기 초기 코드북으로부터 삭제하는 수단; 및1 < i ≤ K 인 각 Ni 에 대해:(a) 상기 초기 코드북으로부터 Ni - Ni-1 개의 재생 벡터들을 선택하여 상기 접합 코드북으로 복사된 Ni-1 개의 재생 벡터들 및 상기 선택된 재생 벡터들을 포함하는 코드북의 상기 트레이닝 벡터들의 모두에 대한 왜곡이 최소가 되도록 하는 단계; 및(b) 상기 선택된 재생 벡터들을 상기 초기 코드북으로부터 상기 접합 코드북 내의 다음 빈 위치의 증가하는 자리로 복사하고 상기 선택된 재생 벡터들을 상기 초기 코드북으로부터 삭제하는 단계;인상기 (a) 내지 (b)를 반복하는 수단;을 포함하는, 접합 코드북 결정 장치.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/214,484 | 2005-08-29 | ||
US11/214,484 US7587314B2 (en) | 2005-08-29 | 2005-08-29 | Single-codebook vector quantization for multiple-rate applications |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20080039523A KR20080039523A (ko) | 2008-05-07 |
KR100982211B1 true KR100982211B1 (ko) | 2010-09-14 |
Family
ID=37697832
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020087007436A KR100982211B1 (ko) | 2005-08-29 | 2006-08-25 | 다중의 속도 애플리케이션에 대한 단일 코드북 벡터 양자화 |
Country Status (17)
Country | Link |
---|---|
US (1) | US7587314B2 (ko) |
EP (1) | EP1920434B1 (ko) |
JP (1) | JP4777429B2 (ko) |
KR (1) | KR100982211B1 (ko) |
CN (1) | CN101288118B (ko) |
AT (1) | ATE446571T1 (ko) |
AU (1) | AU2006286177C1 (ko) |
BR (1) | BRPI0615709B1 (ko) |
DE (1) | DE602006009950D1 (ko) |
ES (1) | ES2332330T3 (ko) |
HK (1) | HK1122640A1 (ko) |
MX (1) | MX2008002434A (ko) |
MY (1) | MY144576A (ko) |
PL (1) | PL1920434T3 (ko) |
RU (1) | RU2391715C2 (ko) |
WO (1) | WO2007026295A2 (ko) |
ZA (1) | ZA200801844B (ko) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7966175B2 (en) * | 2006-10-18 | 2011-06-21 | Polycom, Inc. | Fast lattice vector quantization |
US7961640B2 (en) * | 2006-10-26 | 2011-06-14 | Qualcomm Incorporated | Method and apparatus for codebook exchange in a multiple access wireless communication system |
JP5006404B2 (ja) | 2006-12-05 | 2012-08-22 | ホアウェイ・テクノロジーズ・カンパニー・リミテッド | ベクトル量子化装置 |
US7813922B2 (en) * | 2007-01-30 | 2010-10-12 | Nokia Corporation | Audio quantization |
RU2461079C2 (ru) * | 2008-02-15 | 2012-09-10 | Нокиа Корпорейшн | Упрощенная индексация и деиндексация векторов |
US20100257174A1 (en) * | 2009-04-02 | 2010-10-07 | Matthew Dino Minuti | Method for data compression utilizing pattern-analysis and matching means such as neural networks |
CN101577551A (zh) * | 2009-05-27 | 2009-11-11 | 华为技术有限公司 | 一种生成格型矢量量化码书的方法及装置 |
KR101826331B1 (ko) | 2010-09-15 | 2018-03-22 | 삼성전자주식회사 | 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법 |
SG191771A1 (en) | 2010-12-29 | 2013-08-30 | Samsung Electronics Co Ltd | Apparatus and method for encoding/decoding for high-frequency bandwidth extension |
EP4274235A3 (en) * | 2012-03-29 | 2024-01-10 | Telefonaktiebolaget LM Ericsson (publ) | Vector quantizer |
US9304703B1 (en) * | 2015-04-15 | 2016-04-05 | Symbolic Io Corporation | Method and apparatus for dense hyper IO digital retention |
CA2959450C (en) * | 2014-08-28 | 2019-11-12 | Nokia Technologies Oy | Audio parameter quantization |
CN108028045A (zh) * | 2015-07-06 | 2018-05-11 | 诺基亚技术有限公司 | 用于音频信号解码器的位错误检测器 |
US10531099B2 (en) * | 2016-09-30 | 2020-01-07 | The Mitre Corporation | Systems and methods for distributed quantization of multimodal images |
CN112036821B (zh) * | 2020-08-24 | 2024-02-02 | 智能创谷(北京)科技有限公司 | 基于网格图规划专线的量化方法、装置、介质和电子设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5151968A (en) | 1989-08-04 | 1992-09-29 | Fujitsu Limited | Vector quantization encoder and vector quantization decoder |
WO2004015689A1 (en) | 2002-08-08 | 2004-02-19 | Qualcomm Incorporated | Bandwidth-adaptive quantization |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5734791A (en) * | 1992-12-31 | 1998-03-31 | Apple Computer, Inc. | Rapid tree-based method for vector quantization |
US5481739A (en) * | 1993-06-23 | 1996-01-02 | Apple Computer, Inc. | Vector quantization using thresholds |
WO1995010760A2 (en) * | 1993-10-08 | 1995-04-20 | Comsat Corporation | Improved low bit rate vocoders and methods of operation therefor |
GB2300548B (en) * | 1995-05-02 | 2000-01-12 | Motorola Ltd | Method for a communications system |
US6215910B1 (en) * | 1996-03-28 | 2001-04-10 | Microsoft Corporation | Table-based compression with embedded coding |
US6952671B1 (en) * | 1999-10-04 | 2005-10-04 | Xvd Corporation | Vector quantization with a non-structured codebook for audio compression |
US6504877B1 (en) * | 1999-12-14 | 2003-01-07 | Agere Systems Inc. | Successively refinable Trellis-Based Scalar Vector quantizers |
CA2388358A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for multi-rate lattice vector quantization |
CA2415105A1 (en) * | 2002-12-24 | 2004-06-24 | Voiceage Corporation | A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding |
US7680670B2 (en) * | 2004-01-30 | 2010-03-16 | France Telecom | Dimensional vector and variable resolution quantization |
DE602004026645D1 (de) * | 2004-07-23 | 2010-05-27 | Telecom Italia Spa | Verfahren zum erzeugen und verwenden eines vektorcodebuchs, verfahren und einrichtung zum komprimieren von daten und verteiltes spracherkennungssystem |
US20060080090A1 (en) * | 2004-10-07 | 2006-04-13 | Nokia Corporation | Reusing codebooks in parameter quantization |
US8510105B2 (en) * | 2005-10-21 | 2013-08-13 | Nokia Corporation | Compression and decompression of data vectors |
JP5006404B2 (ja) * | 2006-12-05 | 2012-08-22 | ホアウェイ・テクノロジーズ・カンパニー・リミテッド | ベクトル量子化装置 |
-
2005
- 2005-08-29 US US11/214,484 patent/US7587314B2/en active Active
-
2006
- 2006-08-25 EP EP06795778A patent/EP1920434B1/en active Active
- 2006-08-25 RU RU2008106651/09A patent/RU2391715C2/ru active
- 2006-08-25 PL PL06795778T patent/PL1920434T3/pl unknown
- 2006-08-25 BR BRPI0615709-2A patent/BRPI0615709B1/pt active IP Right Grant
- 2006-08-25 KR KR1020087007436A patent/KR100982211B1/ko active IP Right Grant
- 2006-08-25 ES ES06795778T patent/ES2332330T3/es active Active
- 2006-08-25 MY MYPI20080321A patent/MY144576A/en unknown
- 2006-08-25 JP JP2008528619A patent/JP4777429B2/ja active Active
- 2006-08-25 MX MX2008002434A patent/MX2008002434A/es active IP Right Grant
- 2006-08-25 AU AU2006286177A patent/AU2006286177C1/en active Active
- 2006-08-25 DE DE602006009950T patent/DE602006009950D1/de active Active
- 2006-08-25 WO PCT/IB2006/052956 patent/WO2007026295A2/en active Application Filing
- 2006-08-25 CN CN2006800354118A patent/CN101288118B/zh active Active
- 2006-08-25 AT AT06795778T patent/ATE446571T1/de not_active IP Right Cessation
-
2008
- 2008-02-27 ZA ZA200801844A patent/ZA200801844B/xx unknown
-
2009
- 2009-03-27 HK HK09102938.2A patent/HK1122640A1/xx unknown
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5151968A (en) | 1989-08-04 | 1992-09-29 | Fujitsu Limited | Vector quantization encoder and vector quantization decoder |
WO2004015689A1 (en) | 2002-08-08 | 2004-02-19 | Qualcomm Incorporated | Bandwidth-adaptive quantization |
Also Published As
Publication number | Publication date |
---|---|
ZA200801844B (en) | 2009-10-28 |
BRPI0615709B1 (pt) | 2019-08-20 |
AU2006286177A1 (en) | 2007-03-08 |
DE602006009950D1 (de) | 2009-12-03 |
HK1122640A1 (en) | 2009-05-22 |
ES2332330T3 (es) | 2010-02-02 |
RU2008106651A (ru) | 2009-10-10 |
BRPI0615709A2 (pt) | 2011-05-24 |
CN101288118B (zh) | 2011-07-20 |
CN101288118A (zh) | 2008-10-15 |
PL1920434T3 (pl) | 2010-03-31 |
AU2006286177B2 (en) | 2011-04-14 |
ATE446571T1 (de) | 2009-11-15 |
RU2391715C2 (ru) | 2010-06-10 |
KR20080039523A (ko) | 2008-05-07 |
MX2008002434A (es) | 2008-04-03 |
US7587314B2 (en) | 2009-09-08 |
WO2007026295A3 (en) | 2007-07-05 |
MY144576A (en) | 2011-10-14 |
JP4777429B2 (ja) | 2011-09-21 |
US20070055509A1 (en) | 2007-03-08 |
EP1920434B1 (en) | 2009-10-21 |
JP2009506368A (ja) | 2009-02-12 |
WO2007026295A2 (en) | 2007-03-08 |
AU2006286177C1 (en) | 2011-08-18 |
EP1920434A2 (en) | 2008-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100982211B1 (ko) | 다중의 속도 애플리케이션에 대한 단일 코드북 벡터 양자화 | |
EP2274833B1 (en) | Vector quantisation method | |
US7106228B2 (en) | Method and system for multi-rate lattice vector quantization of a signal | |
Vasuki et al. | A review of vector quantization techniques | |
US6504877B1 (en) | Successively refinable Trellis-Based Scalar Vector quantizers | |
US4791654A (en) | Resisting the effects of channel noise in digital transmission of information | |
US8558724B2 (en) | Coding method, coding appartaus, decoding method, decoding apparatus, program, and recording medium | |
JP7356513B2 (ja) | ニューラルネットワークのパラメータを圧縮する方法および装置 | |
KR101170137B1 (ko) | 복잡성이 축소된 벡터 인덱싱 및 탈-인덱싱 | |
Sitaram et al. | Efficient codebooks for vector quantization image compression with an adaptive tree search algorithm | |
JP4508490B2 (ja) | 符号化装置および復号化装置 | |
Effros et al. | Multiresolution vector quantization | |
Aksu et al. | Multistage trellis coded quantisation (MS-TCQ) design and performance | |
Cao et al. | A fast search algorithm for vector quantization using a directed graph | |
CN103366752B (zh) | 生成用于编码信息信号的候选码矢的方法和设备 | |
Bouzid et al. | Optimized trellis coded vector quantization of LSF parameters, application to the 4.8 kbps FS1016 speech coder | |
Gersho et al. | Vector quantization techniques in speech coding | |
Hwang et al. | Genetic entropy-constrained vector quantizer design algorithm | |
Popescu et al. | CELP coding using trellis-coded vector quantization of the excitation | |
Vasilache et al. | Robust indexing of lattices and permutation codes over binary symmetric channels | |
CA2482994C (en) | Method and system for multi-rate lattice vector quantization of a signal | |
WO2008003832A1 (en) | Method of treating voice information | |
JPH08101700A (ja) | ベクトル量子化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130820 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20140825 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20150819 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20160818 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20170818 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20180816 Year of fee payment: 9 |