KR101443170B1 - 다단계 양자화 방법 및 저장 매체 - Google Patents

다단계 양자화 방법 및 저장 매체 Download PDF

Info

Publication number
KR101443170B1
KR101443170B1 KR1020127009738A KR20127009738A KR101443170B1 KR 101443170 B1 KR101443170 B1 KR 101443170B1 KR 1020127009738 A KR1020127009738 A KR 1020127009738A KR 20127009738 A KR20127009738 A KR 20127009738A KR 101443170 B1 KR101443170 B1 KR 101443170B1
Authority
KR
South Korea
Prior art keywords
codebook
quantization
scaling factor
stage
previous step
Prior art date
Application number
KR1020127009738A
Other languages
English (en)
Other versions
KR20120043160A (ko
Inventor
이얄 슬로못
진리앙 다이
푸리앙 인
신 마
준 장
Original Assignee
후아웨이 테크놀러지 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후아웨이 테크놀러지 컴퍼니 리미티드 filed Critical 후아웨이 테크놀러지 컴퍼니 리미티드
Publication of KR20120043160A publication Critical patent/KR20120043160A/ko
Application granted granted Critical
Publication of KR101443170B1 publication Critical patent/KR101443170B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3082Vector coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • G10L2019/0005Multi-stage vector quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0007Codebook element generation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 다단계 양자화 방법을 개시하고 있다. 다단계 양자화 방법은 이전 단계 코드북에 기초하여 기준 코드북을 획득하는 단계, 상기 기준 코드북 및 스케일링 인자에 기초하여 현재 단계 코드북을 획득하는 단계 및 상기 현재 단계 코드북을 활용하여 상기 입력 벡터를 양자화하는 단계를 포함한다. 또한 본 발명은 다단계 양자화 장치를 개시하고 있다. 본 발명에 따르면, 현재 단계 코드북은, 현재 단계 코드북과 이전 단계 코드북 사이의 상관관계를 사용하여, 이전 단계 코드북에 기초하여 획득될 수 있다. 결과적으로, 현재 단계 코드북을 위한 독립적인 코드북 공간을 필요로 하지 않아, 저장 공간을 세이브할 수 있고 리소스 사용 효율성이 향상된다(도 2).

Description

다단계 양자화 방법 및 저장 매체{MULTI-STAGE QUANTIZING METHOD AND STORAGE MEDIUM}
본 발명은 데이터 압축 기술에 관한 것이며, 구체적으로 다단계 양자화를 위한 방법 및 장치에 관한 것이다.
데이터 압축 기술의 급속한 발전에 따라, 벡터 양자화가 폭넓게 사용되고 있다. 벡터 양자화(VQ: Vector Quantization)는 효과적인 데이터 압축 기술로서, 복수의 스칼라 데이터 열(scalar data column)을 벡터로 구성하고 벡터 공간에서 전체적인 양자화를 수행한다. 그 결과, 정보를 훨씬 손실하지 않으면서 데이터를 압축한다. VQ의 절차는 다음과 같다: 신호 파형의 k개의 샘플의 각각의 프레임 또는 k개의 파라미터로 이루어진 각각의 파라미터 세트를 k 차원의 유클리드 공간에서의 벡터로 구성하고, 그런 다음 벡터를 "집합적으로" 양자화한다. 벡터가 양자화되면, k 차원의 무한 공간은 경계가 있는 M개의 영역으로 분할되고, 입력 신호 벡터는 이러한 경계와 비교되고 한 영역의 중심 벡터로 양자화되며, 상기 한 영역의 경계들은 입력 신호 벡터로부터의 최소 "거리"를 가진다. VQ의 계산 복잡도는 소정의 왜곡 측정 기준에 따른 코드북 검색에 주로 관한 것이고, 공간 복잡도는 사용된 코드북 공간의 크기에 의해 주로 결정된다. 일반적으로, 코드북 공간이 클수록 필요한 저장도 커지게 되고, 코드북 검색의 계산 복잡도가 높을수록 양자화 정확도가 높게 된다.
현재, VQ의 계산 복잡도는 일반적으로 다단계 양자화 또는 분할 코드북 양자화를 사용함으로써 감소한다. 2-단계 양자화 과정은, 도 1에 도시된 바와 같이, 입력 벡터 x가 코드북 1을 사용하여 제1 단계 VQ를 수행한 다음 코드북 2를 사용하여 제2 단계 VQ를 수행한다. M1 및 M2의 코드북 크기는 VQ의 두 개의 단계에서 각각 사용되지만, 이와 같은 코드북 효과는 M1*M2의 크기를 가지는 1-단계의 VQ와 동등하다. 그러므로 1-단계의 VQ 시스템과는 대조적으로, 왜곡 및 비교를 위한 계산 횟수 및 필요한 코드북의 저장량은 M1*M2에서 M1+M2로 각각 감소한다.
분할 코드북 양자화 방법은 검색할 때의 복잡도 및 고차원의 벡터를 사용할 때의 저장량을 감소하는 데 사용된다. 이 방법에서, 양자화될 벡터는 양자화를 위해 2 이상의 서브-벡터로 분할된다. 벡터를 2개의 서브-벡터로 분할하는 예에 대해서는 이하에 서술한다. 입력 벡터를 x=[x1, x2 ..., xN]T라 하고, 사용된 코드북을 Y라 하며, 그리고 양자화된 비트 길이를 L이라 하면, 코드북 Y를 저장하는 데 필요한 저장 공간은 N×2L이다. x가 두 개의 서브벡터 xa=[x1, x2 ..., xK]T xb=[xK+1, xK +2 ..., xN]T로 분할되면, 사용된 코드북은 그에 따라 Ya 및 Yb로 분할된다. 양자화된 xa가 La의 비트 길이를 가지고, 양자화된 xb가 Lb의 비트 길이를 가지면(단, L=La+Lb), 코드북 Ya를 저장하는 데 필요한 저장 공간은 K×2La이고, 코드북 Yb를 저장하는 데 필요한 저장 공간은 (N-K)×2Lb이며, 따라서 필요한 총 저장 공간은 코드북 Y를 저장하는 데 필요한 저장 공간 N×2L보다 훨씬 작다. 특히, xa 및 xb의 차원이 동일하고 대응하는 차원 구성요소(dimension components)가 유사한 통계적 속성을 가지는 경우에는, 즉 Ya=Yb인 경우에는, 더 많은 저장 공간을 세이브할 수 있다.
국제통신연합(ITU: International Telecommunication Union)에 의한 음성 코딩 표준 "복합 구조의 수학식 코드 여진 선형 예측 음성 인코더(conjugate-structure algebraic-code-excited linear prediction voice encoder)"에 따르면, 신호 스펙트럼 파라미터, 즉 선형 예측 코딩 분석 후에 획득된 선형 스펙트럼 주파수(LSF: Linear Spectrum Frequency)은 제4차 이동 평균(Moving Average: MA) 모델 예측 양자화기를 사용함으로써 양자화되어 현재 프레임의 LSF 계수를 예측한다. 2-단계 VQ를 사용하여 예측 에러를 양자화한다. 제1 단계는 7 비트 코드를 가지는 코드북 L1을 사용하여 10 차원 벡터를 진행한다. 제2 단계는 이 10 차원 벡터를 두 개의 5 차원 코드북 L2 및 L3로 분할하는 데, 여기서 L2는 하위 5 차원을 나타내고 L3은 상위 5 차원을 나타내며, 이 둘 모두는 5 비트 코드를 사용한다.
그렇지만, ITU에 의한 "복합 구조의 수학식 코드 여진 선형 예측 음성 인코더의 무음 압축 솔루션(silence compression solution of conjugate-structure algebraic-code-excited linear prediction voice encoder)"에 따르면, 노이즈 프레임의 LSF 계수의 VQ는 2-단계 양자화를 사용해서 행해진다. 제1 단계 양자화기의 입력은 예측기의 예측 에러이고, 제1 단계로부터의 양자화 에러는 제2 단계에서 양자화된다. 노이즈 프레임에 대한 제1 단계 양자화 코드북은 음성 프레임에 대한 제1 단계 코드북의 서브세트이고, 노이즈 프레임에 대한 제2 단계 양자화 코드북은 음성 프레임에 대한 제2 단계 양자화 코드북은 음성 프레임에 대한 제2 단계 코드북의 서브세트이다. 즉, 길이가 16 비트인 두 개의 서브-코드북을 길이가 32 비트인 두 개의 코드북에 연결할 수 있으며, 이 두 개의 코드북은 모두 제2 단계 양자화 코드북이며, 코드북 인덱스는 어레이로 저장된다.
본 발명을 실행하는 동안, 발명자는 이하와 같은 종래 기술의 단점을 알고 있다:
VQ 과정의 계산 복잡도는 다단계 양자화 방법을 사용하여 감소할 때, 각 단계에서의 양자화를 위한 코드북들은 서로 독립적이며 각각의 코드북은 대응하는 코드북 공간을 필요로 한다. 결과적으로, 저장 공간은 허비되고 자원활용도는 낮다.
본 발명의 목적은 종래 기술의 단점, 즉 각각의 양자화 단계의 독립적인 코드북들에 의해 야기되는 저장 공간에서의 소모를 극복할 수 있는 다단계 양자화 방법 및 장치를 제공하는 것이다.
이 목적을 위해, 본 발명의 실시예는 다단계 양자화 방법을 제공하며, 상기 방법은,
이전 단계 코드북에 따라 기준 코드북을 획득하는 단계;
상기 기준 코드북 및 스케일링 인자(scaling factor)에 따라 현재 단계 코드북을 획득하는 단계; 및
상기 현재 단계 코드북을 사용하여 입력 벡터를 양자화하는 단계
를 포함한다.
본 발명의 다른 실시예는 다단계 양자화 장치를 제공하며, 상기 장치는,
이전 단계 코드북 또는 둘 이상의 이전 단계의 코드북들을 저장하도록 구성되어 있는 이전 단계 코드북 저장 유닛;
상기 이전 단계 코드북 저장 유닛에 의해 저장된 코드북(들)에 따라 기준 코드북을 획득하도록 구성되어 있는 기준 코드북 획득 유닛;
스케일링 인자를 저장하도록 구성되어 있는 스케일링 인자 저장 유닛;
상기 기준 코드북 획득 유닛에 의해 획득된 상기 기준 코드북 및 상기 스케일링 인자 저장 유닛에 의해 저장되어 있는 상기 스케일링 인자에 따라 현재 저장 코드북을 획득하도록 구성되어 있는 현재 저장 코드북 획득 유닛; 및
상기 현재 단계 코드북 획득 유닛에 의해 획득된 상기 현재 단계 코드북을 사용하여 입력 벡터를 양자화하도록 구성되어 있는 벡터 양자화 유닛
을 포함한다.
전술한 기술적 솔루션에 대한 실시예는 다음과 같은 이점을 가진다: 현재 단계 코드북은 현재 단계 코드북과 이전 단계 코드북 간의 상관관계를 사용함으로써 이전 단계 코드북에 따라 획득될 수 있다. 결과적으로, 현재 단계 코드북에 대한 독립적인 코드북 공간을 필요로 하지 않아, 저장 공간을 세이브하고 리소스 사용 효율성을 향상시킨다.
도 1은 종래 기술의 2-단계 양자화에 대한 흐름도이다.
도 2는 본 발명의 실시예에 따른 2-단계 양자화에 대한 흐름도이다.
도 3은 본 발명의 다른 실시예에 따른 2-단계 양자화에 대한 흐름도이다.
도 4는 본 발명의 실시예에 따른 3-단계 양자화에 대한 흐름도이다.
도 5는 본 발명의 실시예에 따른 다단계 장치에 대한 블록도이다.
도 6은 본 발명의 다른 실시예에 따른 3-단계 양자화에 대한 흐름도이다.
도 7은 본 발명의 다른 실시예에 따른 다단계 장치에 대한 블록도이다.
이하, 예 및 도면을 참조하여 본 발명의 실시예에 대해 더 상세히 설명한다.
선형 예측 음성 코딩에서는, 선형 예측 파라미터들에 대한 벡터 양자화를 수행해야 한다. 일례로서, 2-단계 양자화를 통해 선형 예측 파라미터를 10-차원 LSF 파라미터로 변환하는 것을 들 수 있다.
본 발명의 실시예에 따른 2-단계 양자화 방법에 대한 흐름도가 도 2에 도시되어 있으며, 구체적으로 이하의 단계를 포함한다:
먼저 스케일링 인자(세트) γ를 얻으며, 이것은 다음과 같은 트레이닝 방법을 통해 행해진다.
γ은 많은 샘플을 트레이닝함으로써 획득될 수 있으며, 제1 단계 양자화 후에 획득된 양자화 에러 벡터 공간의 라듐(radium)과 제1 단계 양자화 입력 벡터 공간의 라듐을 비교함으로써 가장 간단한 트레이닝 방법을 수행할 수 있다. L개의 샘플이 있고, 각각의 샘플이 N-차원 벡터인 것으로 가정하면, 제1 단계 양자화 에러는 다음과 같다:
x1=[x1,0, x1,1 ..., x1,N-1]T
단, x1,0, x1,1 ..., x1,N-1은 각각 각 차원의 이전 단계 양자화 벡터에 대한 양자화 에러 값들이다.
또한, 제1 단계 양자화 벡터는 다음과 같다:
x0=[x0,0, x0,1 ..., x0,N-1]T
*단, x0,0, x0,1 ..., x0,N-1은 각각 각 차원의 이전 단계 양자화 벡터에 대한 값들이다.
이 경우, 스케일링 인자 γ는 다음의 식을 통해 계산될 수 있다:
Figure 112012029960698-pat00001

대안으로, γ의 최적 값을 최소 평균 제곱 에러(Minimum Mean Square Error: MMSE) 방법에 따라 검색함으로써 검출할 수 있다. 구체적으로, 0 내지 2의 범위는 M개의 부분들로 분할되고 다음과 같이 놓는다:
Figure 112012029960698-pat00002

γ 값들의 M개의 부분들은 이전 단계 코드북 Y1과 승산되어 M개의 새로운 코드북들을 획득한다:
γ1Y1, γ2Y1,...γM-1Y1
M개의 코드북들은 샘플 벡터들을 양자화하는 데 각각 사용된다. L개의 샘플이 있는 경우, j번째 새로운 코드북을 각각의 샘플 벡터를 양자화하는 데 사용하여 각각의 샘플 벡터에 대한 최적의 코드북 벡터를 검색하고 그 사이에 최소의 가중된 양자화 에러 ej ,i를 얻는다. 모든 샘플의 최소 가중 양자화 에러의 합은 다음과 같다고 가정한다:
Figure 112012029960698-pat00003

각각의 코드북 γjY1은 Ej에 대응한다. Ej의 최소값 Emin은 검출될 수 있으며, γj는 최적의 스케일링 값 γ의 값이다. 양자화 정확성이 충분히 높진 않은 경우에는, 범위(γmin-1/N, γmin+1/N)를 N개의 부분들로 더 분할할 수 있고, 그런 다음 최적의 γ가 Nγ 값들에서 검출된다. 이 과정은 그 필요한 정확성이 달성될 때까지 반복될 수 있다.
전술한 바는 γ가 단지 하나인 경우이며, 둘 이상의 γ 값들을 트레이닝하고 어레이로 저장할 수 있다. γ의 인덱스는 n 비트를 사용하여 양자화될 수 있다. 결과적으로, 원래의 코드북의 수는 2n만큼 증가한다. 그 사이에, 코드북의 채택 가능성(adaptability)은 향상되고 양자화 정확성은 높아질 수 있다.
블록 s201에서, 기존의 양자화 기술에 따라 선형 예측 음성 코딩의 선형 예측 파라미터에 대해 벡터 양자화를 수행하여 인덱스 값 idx1을 획득하고, 이 인덱스 값은 7 비트 코드에 의해 나타내어진다. 이것이 제1 단계 VQ이며, 제1 단계 양자화 코드북은 Y1={yi|i = 0,...27-1}로서 표현된다.
블록 s202에서, 제1 단계 양자화 코드북은 제2 단계 양자화에서 기준 코드북으로서 사용된다:
Y1={yi|i = 0,...27-1}
제2 단계 양자화 코드북과 제1 단계 양자화 코드북 사이의 스케일링 인자 벡터 Λn은 이미 트레이닝 되었으며, 이것은 N 비트, 즉 Λn-1={γi|i = 0,...2N-1}를 사용해서 양자화될 수 있다.
상기 방법에 기초하여, 제2 단계 양자화 코드북의 크기는 7+N 비트이며, 코드북은 다음과 같다:
YniㆍYn -1, i = 0, ... 2N-1
이전에 정의된 스케일링 인자 세트 γ 내의 스케일링 인자들의 값들은 기준 코드북으로서 사용되는 제1 단계 코드북 Y1과 승산되고, 2N-1개의 새로운 코드북, 즉 γ0Y1γ1Y1...γM-1Y1을 획득한다. 그러므로 2N-1개의 제2 단계 양자화 코드북으로 이루어지는 코드북 세트가 획득된다. 프로세스는 블록 s203으로 진행한다.
블록 s203에서, 샘플 벡터는 블록 s202에서 획득된 2N-1개의 코드북 중 대응하는 코드북을 사용함으로써 양자화된다. 구체적으로, 제1 단계 양자화 에러는 제2 단계 양자화의 입력 벡터로서 취해지고, 생성된 2N 코드북들은 완전히 검색된다. 그런 다음, 위치 인덱스 idx 2 및 위치 인덱스 fidx는 제2 단계 양자화의 출력으로서 취해지는데, 여기서 위치 인덱스 dix2는 코드북에서 벡터의 위치를 나타내면서 이하의 가중된 평균 제곱 에러가 최소값을 가지게 하며, 위치 인덱스 difx는 코드북 세트에서 코드북의 위치를 나타낸다:
Figure 112012029960698-pat00004

역양자화 동안, 먼저, 제1 단계 양자화 인덱스 dix1을 사용함으로써 제1 단계 역양자화된 벡터가 제1 단계 코드북들에서 검출되고 Y1(idx1)로 표시된다. 다음, 대응하는 스케일링 인자 γfidx가 스케일링 인자 세트 γ로부터 획득된다. γfidx×Y1은 코딩 종료 시에 사용되는 제2 단계 코드북이고, 따라서 제2 단계에서 재구성된 벡터는 γfidx×Y1(idx2)이고, 최종적인 역양자화 결과는 Y1(idx1)+γfidx×Y1(idx2)이다.
실시예에 따르면, 현재 단계 코드북들과 이전 단계 코드북들 간의 상관관계를 이용함으로써 이전 단계 코드북들에 따라 현재 단계 코드북들을 획득할 수 있다. 결과적으로, 현재 단계 코드북을 위한 독립적인 코드북 공간을 필요로 하지 않아, 저장 공간을 세이브할 수 있고 리소스 사용 효율성이 향상된다.
여기서, 이전 단계 코드북들은 구체적으로 이전 단계 코드북 또는 둘 이상의 이전 단계의 코드북들을 포함할 수 있다. 세트에 포함되어 있는 컨텐츠에서의 차이는 본 발명의 보호 범위를 아무런 영향을 미치지 않을 것이다.
도 3은 본 발명의 다른 실시예에 따른 2-단계 양자화 방법을 도시하고 있으며, 구체적으로 이하의 단계를 포함한다:
블록 s301에서, 기존의 양자화 기술에 따라 선형 예측 음성 코딩의 선형 예측 파라미터에 대해 벡터 양자화를 수행하여 인덱스 값 idx1을 획득하고, 이 인덱스 값은 7 비트 코드를 사용하여 나타내어진다. 즉, 제1 단계 VQ에서, 제1 단계 양자화 코드북은 Y1={yi|i = 0,...27-1}인 것으로 가정한다.
제1 단계 양자화 후, 양자화 에러의 다이내믹 레인지(dynamic range)는 더 감소된다. 이때, 이전 단계 코드북에서의 벡터들은 결합되어 코드북 길이가 감소하고, 이것은 비트를 세이브할 것이다. 예를 들어, 빈번하게 사용되는 K 비트 코드북은 7 비트의 제1 단계 코드북으로부터 미리 선택될 수 있고 K 비트 코드북들의 인덱스들은 어레이로 저장되며, 이것은 cb(i),i=0,1,...,2K-1로서 나타내어질 수 있다. K 비트의 인덱스들은 제2 단계 코드북을 위한 기준 코드북 Y2c를 형성한다.
블록 s302에서, 제2 단계 양자화 코드북과 제1 양자화 코드북 간의 스케일링 인자 벡터 Λn은 이미 트레이닝 되었으며, N 비트, 즉 Λn-1={γi|i = 0,...2N-1}를 사용하여 양자화된다. 위의 방법에 기초하여, 제2 단계 양자화 코드북의 크기는 K+N 비트이며, 코드북은 다음과 같다:
Y2iㆍY2c, i = 0, ... 2N-1
코드북의 길이는 더 감소할 수 있다. 빈번하게 사용되는 K 비트 코드북들은 7 비트의 제1 단계 코드북들 중에서 선택되며, 가장 빈번하게 사용되는 K 비트 코드북들의 인덱스들은 어레이로 저장되며, 이것은 cd(i),i=0,1,...,2K-1로 나타내어질 수 있다. 그러므로 제2 단계 양자화 결과는 K+N 비트이다. 제거된 것은 빈번하게 사용된 약간의 코드북이며, 결과적으로 양자화된 비트의 수가 감소하는 동안 양자화에 대한 손실은 크지 않다.
블록 s303에서, 제1 단계 양자화 에러를 타겟 벡터로서 취하고, 위의 2N 코드북들은 최상의 코드-벡터를 위해 검색되고, 이하의 식에 표시된 바와 같이 가중된 평균 제곱 에러(MSE)는 최소로 될 수 있고, 검출된 코드-벡터의 인덱스는 제2 단계 양자화의 출력으로서 취급된다.
Figure 112012029960698-pat00005

단, Wi는 가중 계수이다. 양자화 출력 결과는 두 개의 부분을 가지며, 그중 한 부분은 코드북에서 코드북 벡터의 위치를 나타내는 위치 인덱스 idx2이고, 다른 부분은 스케일링 인자 벡터에서 스케일링 인자의 위치를 나타내는 인덱스 fidx이다.
역양자화 동안, 먼저, 제1 단계 양자화 인덱스 dix1을 사용함으로써 제1 단계 역양자화된 벡터가 제1 단계 코드북에서 검출되고 Y1(idx1)로 표시된다. 다음, 대응하는 스케일링 인자 γfidx가 스케일링 인자 세트 γ로부터 획득된다. γfidx×Y2c는 코딩 종료 시에 사용되는 제2 단계 코드북이고, 따라서 제2 단계에서 재구성된 벡터는 γfidx×Y2c(cb(idx2))이고, 최종적인 역양자화 결과는 Y1(idx1)+γfidx×Y2c(cb(idx2))이다.
실시예에 따르면, 현재 단계 코드북과 이전 단계 코드북 간의 상관관계를 이용함으로써 이전 단계 코드북에 따라 현재 단계 코드북을 획득할 수 있다. 결과적으로, 현재 단계 코드북을 위한 독립적인 코드북 공간을 필요로 하지 않아, 저장 공간을 세이브할 수 있고 리소스 사용 효율성이 향상된다.
도 4는 본 발명의 다른 실시예에 따른 3-단계 양자화 방법을 도시하고 있다. 실시예에서, 양자화될 벡터는 10-차원이고, 처음의 2 단계를 위한 양자화 방식은 독립적인 코드북들을 사용하고, 제3 단계를 위한 양자화 방식은 본 실시예에 기초한다. 구체적으로, 과정은 이하의 단계를 포함한다.
스케일링 인자 세트를 트레이닝하는 과정은 미리 수행된다:
γ은 많은 샘플을 트레이닝함으로써 획득되며, 제1 단계 양자화 후에 획득된 양자화 에러 벡터 공간의 라듐과 제1 단계 양자화 벡터 공간의 라듐을 비교함으로써 가장 간단한 트레이닝 방법을 수행할 수 있다. L개의 샘플이 있고, 각각의 샘플이 N-차원 벡터인 것으로 가정하면, 제1 단계 양자화 에러는 다음과 같다:
x1=[x1,0, x1,1 ..., x1,N-1]T
또한, 제1 단계 양자화 벡터는 다음과 같다:
x0=[x0,0, x0,1 ..., x0,N-1]T
그러므로 스케일링 인자 γ는 다음의 식을 통해 계산될 수 있다:
Figure 112012029960698-pat00006

대안으로, γ의 최적 값을 MMSE 방법에 따라 검색함으로써 검출할 수 있다. 구체적으로, 0 내지 2는 M개의 부분들로 분할되고 다음과 같이 놓는다:
Figure 112012029960698-pat00007

이러한 γ 값들의 M개의 부분들은 이전 단계 코드북 Y1과 승산되어 M개의 새로운 코드북들을 획득한다:
Figure 112012029960698-pat00008

M개의 코드북들은 샘플 벡터들을 양자화하는 데 각각 사용된다. L개의 샘플이 있는 경우, j번째 새로운 코드북을 각각의 샘플 벡터를 양자화하는 데 사용하여 각각의 샘플 벡터에 대한 최적의 코드북 벡터를 검색하고 그 사이에 최소의 가중된 양자화 에러 ej ,i를 얻는다. 모든 샘플의 최소 가중 양자화 에러의 합은 다음과 같다고 가정한다:
Figure 112012029960698-pat00009

각각의 코드북 γjY1은 Ej에 대응한다. 최소값 Emin은 Ej로부터 검출될 수 있으며, Emin에 대응하는 γj는 최적의 스케일링 인자의 값이다. 양자화 정확성이 충분히 높진 않은 경우에는, 범위(γmin-1/N, γmin+1/N)를 N개의 부분들로 더 분할할 수 있고, Nγ 값들에서 최적 값이 검출될 수 있다. 이 과정은 그 필요한 정확성이 달성될 때까지 반복될 수 있다.
전술한 바는 γ가 단지 하나인 경우이며, 둘 이상의 γ이 트레이닝되어 어레이로 저장될 수 있으며, γ의 인덱스들은 n 비트를 사용하여 양자화될 수 있다. 이 경우, 원래의 코드북의 수는 2n만큼 증가한다. 그 사이에, 코드북의 채택 가능성(adaptability)은 향상되고 양자화 정확성은 높아질 수 있다.
3-단계 양자화의 과정은 다음과 같다:
블록 s401에서, 가중 최소 평균 제곱 에러 방법에 따라 양자화될 입력 벡터를 위해 제1 단계 코드북을 검색하며, 따라서 코드북에서 코드 벡터의 위치를 나타내는 위치 인덱스 idx1이 검출된다.
Figure 112012029960698-pat00010

단, Wi는 가중 계수이다.
블록 s402에서, 제2 단계 양자화의 입력 벡터로서 제1 단계 양자화 에러를 취하고, 분할 양자화를 사용하여 제2 단계 코드북을 두 개의 5-차원 코드북 Y1 2,Y2 2로 분할한다. 블록 s301에서와 유사한 방식으로 상위 5 차원 및 하위 5 차원에 대해 각각 양자화를 수행하면, 그 양자화 결과는 각각 두 개의 위치 인덱스 idx1 2,idx2 2이다.
블록 s403에서, 상위 5 차원 및 하위 5 차원에 대한 양자화 에러는 제3 단계 양자화 벡터로서 각각 계산된다.
블록 s404에서, 제2 단계 양자화의 두 개의 분할 코드북을, 제3 단계 양자화의 두 개의 분할 코드북의 기준 코드북으로서 취한다. 스케일링 인자 어레이에서의 스케일링 인자를 기준 코드북의 계수로서 취하고, 이에 의해 한 쌍의 코드북 세트가 획득된다. 스케일링 인자 코드의 길이는 2N이고, 따라서 2N 쌍의 새로이 획득된 분할 코드북은 각각 다음과 같다:
Figure 112012029960698-pat00011

블록 s405에서, 상위 5 차원 및 하위 5 차원의 제3 단계 양자화 벡터를 위해 대응하는 코드북 세트를 각각 검색한다. 제3 단계 양자화 결과는 각각의 코드북에서 위치 idx1 3,idx2 3이고, 각각은 상위 5 차원 또는 하위 5 차원에 대한 가중된 평균 제곱 에러의 합이 최소로 될 수 있게 하는 벡터를 나타내며, 대응하는 스케일링 인자의 인덱스 fidx는 다음과 같다:
Figure 112012029960698-pat00012

역양자화 동안, 먼저, 제1 단계 양자화 인덱스 dix1을 사용함으로써 제1 단계 역양자화된 벡터가 제1 단계 코드북에서 검출되고 Y1(idx1)로 표시된다. 다음, 제2 단계 양자화 인덱스 idx1 2,idx2 2를 각각 사용함으로써 제2 단계 역양자화의 분할 서브-벡터 Y1 2(idx1 2),Y2 2(idx2 2)를 재구성한다. 그 후, 제3 단계 양자화의 스케일링 인자 인덱스를 사용하여 대응하는 스케일링 인자 γfidx가 스케일링 인자 세트 γ로부터 획득된다. γfidx×Y1 2fidx×Y2 2가 코딩 종료 시에 사용되는 제3 단계 코드북의 두 개의 분할 서브-코드북들이면, 제3 단계의 재구성된 서브-벡터들은 각각 γfidx×Y1 2(idx1 3),γfidx×Y1 2(idx2 3)이고, 최종적인 역양자화 결과는 다음과 같다:
Figure 112012029960698-pat00013

본 실시예에 따르면, 현재 단계 코드북과 이전 단계 코드북 간의 상관관계를 이용함으로써 이전 단계 코드북들에 따라 현재 단계 코드북들을 획득할 수 있다. 결과적으로, 현재 단계 코드북을 위한 독립적인 코드북 공간을 필요로 하지 않아, 저장 공간을 세이브할 수 있고 리소스 사용 효율성이 향상된다.
본 발명의 실시예에 따른 다단계 양자화 장치가 도 5에 도시되어 있으며, 이전 단계 코드북 저장 유닛(51), 기준 코드북 획득 유닛(52), 스케일링 인자 저장 유닛(53), 현재 단계 코드북 획득 유닛(54), 및 벡터 양자화 유닛(55)을 포함한다.
이전 단계 코드북 저장 유닛(51)은 기준 코드북 획득 유닛(52)에 연결되어 있다. 현재 단계 코드북 획득 유닛(54)은 기준 코드북 획득 유닛(52), 스케일링 인자 저장 유닛(53), 및 벡터 양자화 유닛(55)에 각각 연결되어 있다.
이전 단계 코드북 저장 유닛(51)은 이전의 코드북 또는 둘 이상의 이전 단계들의 코드북들을 저장하도록 구성되어 있다.
기준 코드북 획득 유닛(52)은 이전 단계 코드북 저장 유닛(51)에 저장되어 있는 코드북에 따라 기준 코드북을 획득하도록 구성되어 있고, 구체적으로:
이전 단계 코드북 저장 유닛(51)에 저장되어 있는 이전 단계 코드북에 따라 기준 코드북을 획득하거나;
이전 단계 코드북 저장 유닛(51)에 저장되어 있는 이전의 코드북 또는 둘 이상의 이전 단계들의 코드북들 중에서 선택된 코드북에 따라 기준 코드북을 획득하거나; 또는
이전 단계 코드북 저장 유닛(51)에 저장되어 있는 이전 단계 코드북 내의 벡터들을 결합하여 기준 코드북을 생성하도록 구성되어 있다.
스케일링 인자 저장 유닛(53)은 미리 트레이닝함으로써 획득될 수 있는 스케일링 인자를 저장하도록 구성되어 있다.
현재 단계 코드북 획득 유닛(54)은 기준 코드북 획득 유닛(52)에 의해 획득된 기준 코드북 및 축적 인자 저장 유닛(53)에 의해 저장되어 있는 척축 인자에 따라 현재의 저장 코드북을 획득하도록 구성되어 있다.
벡터 양자화 유닛(55)은 현재 단계 코드북 획득 유닛(54)에 의해 획득된 현재 단계 코드북을 사용하여 입력 벡터를 양자화하도록 구성되어 있다.
본 발명의 실시예에 따른 다른 3-단계 양자화 방법이 도 6에 도시되어 있다. 본 실시예에서는, 스펙트럼 파라미터 및 에너지 파라미터가 양자화될 필요가 있다. 일반적으로, 스펙트럼 양자화에 있어서, 그 양자화 정확도 조건에 부합하기 위해서는 다단계 양자화가 필요하며, 반면에 에너지 양자화에 있어서는, 1-단계 양자화로도 그 양자화 정확도 조건에 충분히 부합한다. 에너지 파라미터는 이미 양자화되어 있고 양자화 결과는 idx_E인 것으로 가정한다. 양자화될 스펙트럼은 10-차원인 것으로 가정하고, 처음의 2 단계를 위한 양자화 방식은 독립적인 코드북을 사용하고, 제3 단계에 대한 양자화 방식은 본 발명에 기초한다. 제3 단계를 위해 사용된 스케일링 인자는 스케일링 인자 코드 테이블로부터 획득될 수 있는 반면, 스케일링 인자들의 인덱스들 더 이상 코딩되어 전송될 필요가 없다. 대신, 양자화될 벡터의 제3 단계 양자화를 위한 스케일링 인자를 획득하도록 (양자화될 동일한 벡터나 상이한 벡터들에 대한) 이전 단계 양자화의 인덱스들을 직접적으로 맵핑할 수 있다. 구체적으로, 과정은 이하의 단계를 포함한다:
스케일링 인자 세트를 트레이닝하기 위한 과정은 미리 수행된다:
MMSE 방법에 따라 검색함으로써 최적의 γ 값을 검출할 수 있다. 구체적으로, 0 내지 2가 M개의 부분들로 분할되어 다음과 같이 놓일 수 있다:
Figure 112012029960698-pat00014

γ 값들의 M개의 부분들은 이전 단계 코드북 Y1과 승산되어 M개의 새로운 코드북들을 획득한다:
γ1Y1, γ2Y1,...γM-1Y1
M개의 코드북들은 샘플 벡터들을 양자화하는 데 각각 사용된다. L개의 샘플이 있는 경우, j번째 새로운 코드북을 각각의 샘플 벡터를 양자화하는 데 사용하여 각각의 샘플 벡터에 대한 최적의 코드북 벡터를 검색하고 그 사이에 최소의 가중 양자화 에러 ej ,i를 얻는다. 모든 샘플의 최소 가중 양자화 에러의 합은 다음과 같다고 가정한다:
Figure 112012029960698-pat00015

각각의 코드북 γjY1은 Ej에 대응하고, 최소값 Emin은 Ej로부터 검출되며, Emin에 대응하는 γj는 최적의 스케일링 값 γ의 값이다. 양자화 정확성이 충분히 높진 않은 경우에는, 범위(γmin-1/N, γmin+1/N)를 N개의 부분들로 더 분할할 수 있고, 그런 다음 최적 값이 Nγ 값들에서 검출된다. 이 과정은 그 필요한 정확성이 달성될 때까지 반복될 수 있다.
전술한 트레이닝 과정은 둘 이상의 스케일링 인자를 트레이닝하는 데 사용될 수 있고, 스케일링 인자 어레이로 저장될 수 있다. 스케일링 인자 어레이의 길이는 2n이다. 최적의 스케일링 인자가 제2 실시예에 서술된 방법을 이용하여 2n 스케일링 인자에 따라 어레이로부터 검색되어 코딩되는 경우에는, 계산 복잡도가 너무 높다. 한편, 스케일링 인자의 인덱스를 전송하는 데 부가적인 코드 비트가 필요하다. 이 문제를 극복하기 위해, 본 실시예에서는 복잡도가 낮고 여분의 비트가 필요없는 향상된 양자화 방법이 제안된다.
종료 시에 3-단계 양자화의 과정은 다음과 같다:
블록 s601에서, 가중 최소 평균 제곱 에러 기준에 따라 양자화될 입력 벡터를 위해 제1 단계 코드북을 검색하여, 코드북에서 코드 벡터의 위치 인덱스 idx1을 획득한다.
Figure 112012029960698-pat00016

단, Wi는 가중 계수이다.
블록 s602에서, 제1 단계 양자화 에러를 제2 단계 양자화 벡터로서 취하고, 분리 양자화를 이용하여 제2 단계 코드북을 두 개의 5-차원 코드북 Y1 2,Y2 2로 분할한다. 상위 5 차원 및 하위 5 차원에 있어서, 블록 s301에서 수행된 양자화와 유사한 방식으로 양자화를 각각 수행하면, 양자화 결과는 두 개의 위치 인덱스 idx1 2,idx2 2이다.
블록 s603에서, 상위 5 차원 및 하위 5 차원에 대한 양자화 에러가 제3 단계 양자화 에러로서 각각 계산된다.
블록 s604에서, 양자화될 때, 전술한 바와 같은 전체 스케일링 인자 어레이를 검색함으로써 스케일링 인자의 인덱스를 획득할 수 있다. 이 외에, 이전 단계의 양자화 결과를 비트 맵핑함으로써 스케일링 인자의 인덱스들도 검출할 수 있다. 이 단계에서는, 에너지에 있어서 양자화 인덱스 idx_E의 상위 n 비트를 비트 맵핑함으로써 제3 단계 양자화의 스케일링 인자를 획득할 수 있고, 따라서 제3 단계 코드북을 획득할 수 있다. idx_E가 전체적으로 m 비트를 가지는 것으로 가정하면, 상위 n 비트는 idx_E >> (m-n)이고, 부호 '>>'는 우측 시프팅(shifting)의 동작을 나타낸다. 그러므로 제3 단계의 맵핑된 스케일링 인자는 γidx _E>>(m-n)이다. 따라서, 상위 5 차원 및 하위 5 차원의 제3 단계 코드북들은 각각 다음과 같다:
Figure 112012029960698-pat00017

Figure 112012029960698-pat00018
는 제3 단계 코드북의 기준 코드북이지만, 이것은 제2 단계 양자화 코드북 또는 제2 단계 코드북의 서브-코드북도 될 수 있다.
블록 s605에서, 제3 단계 양자화 벡터의 상위 5 차원 및 하위 5 차원 각각을 위해 제3 단계 코드북을 검색한다. 그러므로 상위 5 차원 서브-벡터 및 하위 5 차원 서브-벡터가 코드북에 있는 그 가중된 평균 제곱 에러들의 최소 합을 가지는 벡터의 위치 idx1 3,idx2 3가 획득된다. 위치 idx1 3,idx2 3는 다음과 같은 제3 단계 양자화 결과이다:
Figure 112012029960698-pat00019

디코딩 종료 시에 역양자화 동안, 먼저, 제1 단계 양자화 인덱스 idx1을 사용함으로써 제1 단계 코드북에서 제1 단계 역양자화된 벡터가 검출되며 Y1(idx1)으로서 나타내어진다. 그런 다음, 제2 단계 역양자화의 분할 서브-벡터는 Y1 2(idx1 2),Y2 2(idx2 2)이고 각각의 제2 단계 양자화 인덱스 idx1 2,idx2 2를 사용함으로써, 제2 단계의 두 개의 분할 서브-코드북으로부터 각각 재구성된다. 그 후, 제3 단계의 스케일링 인자 γidx _E>>(m-n)가 에너지의 양자화 인덱스를 사용함으로써 스케일링 인자 세트 γ로부터 획득된다.
Figure 112012029960698-pat00020
가 인코딩 종료 시에 사용된 제3 단계 코드북의 두 개의 분할 서브-코드북인 경우에는, 재구성된 제3 단계 벡터들은 각각
Figure 112012029960698-pat00021
이고, 최종적인 역양자화 결과는 다음과 같다:
Figure 112012029960698-pat00022

실시예에 따르면, 현재 단계 코드북과 이전 단계 코드북 간의 상관관계를 이용함으로써 이전 단계 코드북에 따라 현재 단계 코드북을 획득할 수 있다. 결과적으로, 현재 단계 코드북을 위한 독립적인 코드북 공간을 필요로 하지 않아, 저장 공간을 세이브할 수 있고 리소스 사용 효율성이 향상된다. 또한, 공지의 양자화 결과를 맵핑함으로써 스케일링 인자를 획득하는 방법이 활용된다. 이에 의해 스케일링 인자를 검색하는 계산 및 스케일링 인자 인덱스에 대한 코딩 비트가 세이브된다. 그러므로 양자화 효율성이 더 향상된다.
또한, 에너지 파라미터의 양자화 결과를 제외한, 실시예의 특정한 적용에서는, 양자화될 스펙트럼 파라미터의 이전 단계 (제1 또는 제2 단계) 양자화 인덱스를 맵핑함으로써 스케일링 인자도 획득될 수 있다. 그러므로 다른 파라미터에 대한 결과조차 이용할 수 없지만, 그럼에도 양자화될 벡터는 본 발명의 솔루션을 사용하여 향상될 수 있다.
도 7에 도시된 바와 같이, 본 발명의 실시예에 따른 다단계 양자화 장치는 스케일링 인자 검색 유닛(71) 또는 스케일링 인자 맵핑 유닛(72) 또는 스케일링 인자 결정 유닛(73)을 더 포함할 수 있다. 구체적으로,
스케일링 인자 검색 유닛(71)은 스케일링 인자 어레이를 검색함으로써 스케일링 인자를 획득하고 이 스케일링 인자를 스케일링 인자 저장 유닛(53)에 전송하도록 구성되어 있으며;
스케일링 인자 맵핑 유닛(72)은 이전 단계의 양자화 결과를 비트 맵핑함으로써 스케일링 인자를 획득하고 이 스케일링 인자를 스케일링 인자 저장 유닛(53)에 전송하도록 구성되어 있으며,
스케일링 인자 결정 유닛(73)은 이전 단계 양자화 에러 및 이전 단계 양자화 벡터에 따라 스케일링 인자를 결정하고 이 스케일링 인자를 스케일링 인자 저장 유닛(53)에 전송하도록 구성되어 있다.
실시예에 따르면, 현재 단계 코드북들과 이전 단계 코드북들 간의 상관관계를 이용함으로써 이전 단계 코드북들에 따라 현재 단계 코드북들을 획득할 수 있다. 결과적으로, 현재 단계 코드북을 위한 독립적인 코드북 공간을 필요로 하지 않아, 저장 공간을 세이브할 수 있고 리소스 사용 효율성이 향상된다.
실시예들에 대한 상세한 설명에 기초하여, 필요한 범용의 하드웨어 플랫폼과 결합한 소프트웨어로 또는 하드웨어만으로 본 발명을 실행할 수 있다는 것을 당업자는 명료하게 이해할 수 있다. 그러나 대부분의 경우 실행에 있어서는 전자가 더 우수하다. 이러한 이해에 기초하여, 종래 기술에 기여할 수 있는 본 발명의 기술적 솔루션은 소프트웨어 제품으로 구현될 수 있다. 컴퓨터 소프트웨어 제품은 저장 매체에 저장되며, 이 저장 매체에는 컴퓨터 장치(예를 들어, 퍼스널 컴퓨터, 서버 또는 네트워크 장치)가 본 발명의 실시예에 의해 서술된 방법을 실행할 수 있게 하는 명령어가 포함되어 있다.
전술한 바는 단지 본 발명의 양호한 실시예에 지나지 않는다. 본 발명 내에서 당업자에 의해 이루어질 수 있는 모든 변형, 등가적 대체 및 개선은 본 발명의 범주에 포함되도록 의도된 것임은 물론이다.

Claims (8)

  1. 다단계 양자화 방법에 있어서,
    이전 단계의 코드북에 따라 기준 코드북을 획득하는 단계;
    상기 이전 단계의 양자화 결과를 획득하는 단계;
    상기 이전 단계의 양자화 결과의 상위 n 비트 - n은 양수 - 를 스케일링 인자의 인덱스로 취하는 단계;
    상기 스케일링 인자의 상기 인덱스에 대응하는 스케일링 인자 어레이로부터 상기 스케일링 인자를 획득하는 단계;
    상기 기준 코드북에 스케일링 인자를 곱하여 현재 단계 코드북을 획득하는 단계; 및
    상기 현재 단계 코드북을 사용하여 입력 벡터를 양자화하는 단계
    를 포함하고,
    상기 스케일링 인자 어레이는 각각이 인덱스에 대응하는 복수의 스케일링 인자를 포함하고,
    상기 이전 단계의 상기 양자화 결과는 이전 단계의 에너지 파라미터의 양자화 결과인, 다단계 양자화 방법.
  2. 제1항에 있어서,
    상기 이전 단계의 상기 양자화 결과는 스펙트럼 파라미터의 양자화 결과를 더 포함하는, 다단계 양자화 방법.
  3. 제1항에 있어서,
    상기 스케일링 인자를 획득하는 단계 이전에, 복수의 스케일링 인자를 포함하는 스케일링 인자 어레이를 획득하는 단계
    를 더 포함하는, 다단계 양자화 방법.
  4. 제3항에 있어서,
    상기 이전 단계의 양자화 에러는 x1=[x1,0, x1,1 ..., x1,N-1]T 이고, 상기 이전 단계의 양자화 입력 벡터는 x0=[x0,0, x0,1 ..., x0,N-1]T 인 경우,
    상기 스케일링 인자는 다음 식
    Figure 712013000428288-pat00023

    을 사용하여 획득되며,
    여기서 L은 샘플 수이고, N은 벡터의 차원의 수이고, x1,0, x1,1 ..., x1,N-1은 각각 각 차원의 이전 단계의 양자화 벡터에 대한 양자화 에러 값들이며, x0,0, x0,1 ..., x0,N-1은 각각 각 차원의 이전 단계의 양자화 벡터에 대한 값들인, 다단계 양자화 방법.
  5. 제3항에 있어서,
    상기 복수의 스케일링 인자를 포함하는 스케일링 인자 어레이를 획득하는 단계는,
    0 내지 2를 M개의 부분들로 분할하고 식
    Figure 712013000428288-pat00024

    에 따라 M개의 γ 값들을 획득하는 단계;
    상기 M개의 γ 값들 및 상기 이전 단계의 코드북 Y1에 따라 M개의 새로운 코드북 γ0Y1, γ1Y1...γM-1Y1을 획득하는 단계; 및
    상기 새로운 M개의 코드북을 사용하여 샘플 벡터를 양자화하고, 식
    Figure 712013000428288-pat00025
    을 사용하여 각각의 코드북에 대해 모든 샘플의 최소 가중 양자화 에러의 합 Ej를 획득하는 단계(단, L은 샘플 수이고 ej,i는 최소 가중 양자화 에러); 및
    각각의 코드북에 대응하는 Ej에 따라 최적의 스케일링 인자 γ를 획득하는 단계
    를 포함하는, 다단계 양자화 방법.
  6. 제1항에 있어서,
    상기 이전 단계의 코드북에 따라 기준 코드북을 획득하는 단계는,
    상기 이전 단계의 코드북 또는 둘 이상의 이전 단계의 코드북들로부터 선택된 코드북에 따라 상기 기준 코드북을 획득하는 단계; 또는
    상기 이전 단계의 코드북에서의 벡터들을 결합하여 상기 기준 코드북을 생성하는 단계
    를 포함하는, 다단계 양자화 방법.
  7. 이전 단계의 코드북에 따라 기준 코드북을 획득하는 단계;
    상기 이전 단계의 양자화 결과를 획득하는 단계;
    상기 이전 단계의 양자화 결과의 상위 n 비트 - n은 양수 - 를 스케일링 인자의 인덱스로 취하는 단계;
    상기 스케일링 인자의 상기 인덱스에 대응하는 스케일링 인자 어레이로부터 상기 스케일링 인자를 획득하는 단계;
    상기 기준 코드북에 스케일링 인자를 곱하여 현재 단계 코드북을 획득하는 단계; 및
    상기 현재 단계 코드북을 사용하여 입력 벡터를 양자화하는 단계
    를 포함하고,
    상기 스케일링 인자 어레이는 각각이 인덱스에 대응하는 복수의 스케일링 인자를 포함하고,
    상기 이전 단계의 상기 양자화 결과는 이전 단계의 에너지 파라미터의 양자화 결과인, 방법을 컴퓨터에 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 저장 매체.
  8. 삭제
KR1020127009738A 2007-11-02 2008-10-31 다단계 양자화 방법 및 저장 매체 KR101443170B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
CN200710166746.X 2007-11-02
CN200710166746 2007-11-02
CN200710197033.X 2007-12-03
CN200710197033XA CN101335004B (zh) 2007-11-02 2007-12-03 一种多级量化的方法及装置
PCT/CN2008/072909 WO2009059557A1 (fr) 2007-11-02 2008-10-31 Procédé et appareil de quantification à niveaux multiples

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020107011340A Division KR101152707B1 (ko) 2007-11-02 2008-10-31 다단계 양자화 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20120043160A KR20120043160A (ko) 2012-05-03
KR101443170B1 true KR101443170B1 (ko) 2014-11-20

Family

ID=40197561

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020107011340A KR101152707B1 (ko) 2007-11-02 2008-10-31 다단계 양자화 방법 및 장치
KR1020127009738A KR101443170B1 (ko) 2007-11-02 2008-10-31 다단계 양자화 방법 및 저장 매체

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020107011340A KR101152707B1 (ko) 2007-11-02 2008-10-31 다단계 양자화 방법 및 장치

Country Status (6)

Country Link
US (1) US8468017B2 (ko)
EP (2) EP2487681A1 (ko)
KR (2) KR101152707B1 (ko)
CN (1) CN101335004B (ko)
RU (1) RU2453932C2 (ko)
WO (1) WO2009059557A1 (ko)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101577551A (zh) * 2009-05-27 2009-11-11 华为技术有限公司 一种生成格型矢量量化码书的方法及装置
US8862465B2 (en) 2010-09-17 2014-10-14 Qualcomm Incorporated Determining pitch cycle energy and scaling an excitation signal
WO2012101483A1 (en) * 2011-01-28 2012-08-02 Nokia Corporation Coding through combination of code vectors
PL2727106T3 (pl) * 2011-07-01 2020-03-31 Nokia Technologies Oy Wieloskalowe wyszukiwanie w książce kodów
CN102307372B (zh) * 2011-08-26 2014-12-17 电信科学技术研究院 一种基于Lloyd-Max量化器的数据压缩方法和设备
US8745022B2 (en) * 2011-11-22 2014-06-03 Navteq B.V. Full text search based on interwoven string tokens
US8738595B2 (en) * 2011-11-22 2014-05-27 Navteq B.V. Location based full text search
US9612339B2 (en) * 2012-03-05 2017-04-04 Texas Instruments Incorporated Detecting satellite signals by storing signal sets spanning code period
US8700661B2 (en) 2012-04-12 2014-04-15 Navteq B.V. Full text search using R-trees
CN104282308B (zh) 2013-07-04 2017-07-14 华为技术有限公司 频域包络的矢量量化方法和装置
CN103794219B (zh) * 2014-01-24 2016-10-05 华南理工大学 一种基于m码字分裂的矢量量化码本生成方法
US9729215B2 (en) 2014-06-23 2017-08-08 Samsung Electronics Co., Ltd. OFDM signal compression
US10580416B2 (en) 2015-07-06 2020-03-03 Nokia Technologies Oy Bit error detector for an audio signal decoder
JP6475273B2 (ja) * 2017-02-16 2019-02-27 ノキア テクノロジーズ オーユー ベクトル量子化
CN110830404A (zh) * 2019-10-31 2020-02-21 西南交通大学 一种基于矢量线性预测的数字移动前传信号量化方法
KR20240033374A (ko) * 2022-09-05 2024-03-12 서울대학교산학협력단 비터비 빔 서치를 이용한 레지듀얼 벡터 양자화 장치, 방법 및 컴퓨터 판독 가능 매체
WO2024179844A1 (en) * 2023-02-27 2024-09-06 Telefonaktiebolaget Lm Ericsson (Publ) Multi-stage vector quantization for audio coding

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5307441A (en) * 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
EP1353323A1 (en) 2000-11-27 2003-10-15 Nippon Telegraph and Telephone Corporation Method, device and program for coding and decoding acoustic parameter, and method, device and program for coding and decoding sound
US6952671B1 (en) * 1999-10-04 2005-10-04 Xvd Corporation Vector quantization with a non-structured codebook for audio compression

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US606592A (en) * 1898-06-28 Water-filter
DE3475518D1 (de) * 1983-08-05 1989-01-12 Du Pont Herbicidal benzenesulfonamides, benzylsulfonamides and benzenesulfamates
US5023910A (en) * 1988-04-08 1991-06-11 At&T Bell Laboratories Vector quantization in a harmonic speech coding arrangement
JP3622365B2 (ja) * 1996-09-26 2005-02-23 ヤマハ株式会社 音声符号化伝送方式
US5974378A (en) * 1997-01-06 1999-10-26 Texas Instruments Incorporated Multi-stage vector quantization with efficient codebook search
TW408298B (en) * 1997-08-28 2000-10-11 Texas Instruments Inc Improved method for switched-predictive quantization
EP1746583B1 (en) * 1997-10-22 2008-09-17 Matsushita Electric Industrial Co., Ltd. Sound encoder and sound decoder
US5966688A (en) * 1997-10-28 1999-10-12 Hughes Electronics Corporation Speech mode based multi-stage vector quantizer
US6141640A (en) * 1998-02-20 2000-10-31 General Electric Company Multistage positive product vector quantization for line spectral frequencies in low rate speech coding
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
DE19845888A1 (de) * 1998-10-06 2000-05-11 Bosch Gmbh Robert Verfahren zur Codierung oder Decodierung von Sprachsignalabtastwerten sowie Coder bzw. Decoder
US6782360B1 (en) * 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6574593B1 (en) * 1999-09-22 2003-06-03 Conexant Systems, Inc. Codebook tables for encoding and decoding
US6581032B1 (en) * 1999-09-22 2003-06-17 Conexant Systems, Inc. Bitstream protocol for transmission of encoded voice signals
US6604070B1 (en) * 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
KR100474833B1 (ko) * 1999-11-17 2005-03-08 삼성전자주식회사 예측 및 멜-스케일 이진 벡터를 이용한 가변 차원스펙트럼 진폭 양자화 방법 및 그 장치
US20040002856A1 (en) * 2002-03-08 2004-01-01 Udaya Bhaskar Multi-rate frequency domain interpolative speech CODEC system
US8090577B2 (en) * 2002-08-08 2012-01-03 Qualcomm Incorported Bandwidth-adaptive quantization
CA2415105A1 (en) * 2002-12-24 2004-06-24 Voiceage Corporation A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
US7551785B2 (en) * 2003-07-03 2009-06-23 Canadian Space Agency Method and system for compressing a continuous data flow in real-time using cluster successive approximation multi-stage vector quantization (SAMVQ)
EP1709743A1 (fr) * 2004-01-30 2006-10-11 France Telecom S.A. Quantification vectorielle en dimension et resolution variables
EP1771841B1 (en) 2004-07-23 2010-04-14 Telecom Italia S.p.A. Method for generating and using a vector codebook, method and device for compressing data, and distributed speech recognition system
US7848925B2 (en) * 2004-09-17 2010-12-07 Panasonic Corporation Scalable encoding apparatus, scalable decoding apparatus, scalable encoding method, scalable decoding method, communication terminal apparatus, and base station apparatus
US8510105B2 (en) * 2005-10-21 2013-08-13 Nokia Corporation Compression and decompression of data vectors
KR100943606B1 (ko) * 2006-03-30 2010-02-24 삼성전자주식회사 디지털 통신 시스템에서 양자화 장치 및 방법
CA2701757C (en) * 2007-10-12 2016-11-22 Panasonic Corporation Vector quantization apparatus, vector dequantization apparatus and the methods

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5307441A (en) * 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
US6952671B1 (en) * 1999-10-04 2005-10-04 Xvd Corporation Vector quantization with a non-structured codebook for audio compression
EP1353323A1 (en) 2000-11-27 2003-10-15 Nippon Telegraph and Telephone Corporation Method, device and program for coding and decoding acoustic parameter, and method, device and program for coding and decoding sound

Also Published As

Publication number Publication date
KR20120043160A (ko) 2012-05-03
EP2487681A1 (en) 2012-08-15
RU2010122308A (ru) 2011-12-10
CN101335004A (zh) 2008-12-31
EP2207167B1 (en) 2012-07-18
KR101152707B1 (ko) 2012-06-15
EP2207167A4 (en) 2010-11-03
US8468017B2 (en) 2013-06-18
EP2207167A1 (en) 2010-07-14
RU2453932C2 (ru) 2012-06-20
KR20100085998A (ko) 2010-07-29
WO2009059557A1 (fr) 2009-05-14
CN101335004B (zh) 2010-04-21
US20100217753A1 (en) 2010-08-26

Similar Documents

Publication Publication Date Title
KR101443170B1 (ko) 다단계 양자화 방법 및 저장 매체
KR100872538B1 (ko) Lpc 파라미터의 벡터 양자화 장치, lpc 파라미터복호화 장치, lpc 계수의 복호화 장치, 기록 매체,음성 부호화 장치, 음성 복호화 장치, 음성 신호 송신장치, 및 음성 신호 수신 장치
US6662154B2 (en) Method and system for information signal coding using combinatorial and huffman codes
RU2509379C2 (ru) Устройство и способ квантования и обратного квантования lpc-фильтров в суперкадре
US8510105B2 (en) Compression and decompression of data vectors
JPH11143499A (ja) 切替え型予測量子化の改良された方法
EP3125241A2 (en) Method and device for quantization of linear prediction coefficient and method and device for inverse quantization
EP3142110B1 (en) Device for quantizing linear predictive coefficient
CN101821800A (zh) 矢量量化装置、矢量反量化装置和其方法
US8493244B2 (en) Vector quantization device, vector inverse-quantization device, and methods of same
JPH08272395A (ja) 音声符号化装置
WO2009090875A1 (ja) ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法
US20040176951A1 (en) LSF coefficient vector quantizer for wideband speech coding
CN102158692A (zh) 编码方法、解码方法、编码器和解码器
JPH11143498A (ja) Lpc係数のベクトル量子化方法
Wang et al. Product code vector quantization of LPC parameters
JPH09230898A (ja) 音響信号変換符号化方法及び復号化方法
Vasilache et al. Predictive multiple-scale lattice VQ for LSF quantization
US8924202B2 (en) Audio signal coding system and method using speech signal rotation prior to lattice vector quantization
JP3194930B2 (ja) 音声符号化装置
KR20010084468A (ko) 음성 부호화기의 lsp 양자화기를 위한 고속 탐색 방법
Mohammadi et al. Efficient Two-Step Spectrum Quantization Methods For Low Rate Speech Coding
Chen et al. An associatively classified partitioned vector quantizer
JP2003008446A (ja) 音声符号化方式
Merazka Codebook Design Using Simulated Annealing Algorithm for Vector Quantization of Line Spectrum Pairs

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
J201 Request for trial against refusal decision
B601 Maintenance of original decision after re-examination before a trial
E801 Decision on dismissal of amendment
J301 Trial decision

Free format text: TRIAL DECISION FOR APPEAL AGAINST DECISION TO DECLINE REFUSAL REQUESTED 20130201

Effective date: 20140324

S901 Examination by remand of revocation
E902 Notification of reason for refusal
GRNO Decision to grant (after opposition)
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20170823

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20180904

Year of fee payment: 5