KR100327476B1 - 분할선스펙트럼쌍의벡터양자화방법 - Google Patents

분할선스펙트럼쌍의벡터양자화방법 Download PDF

Info

Publication number
KR100327476B1
KR100327476B1 KR1019950031678A KR19950031678A KR100327476B1 KR 100327476 B1 KR100327476 B1 KR 100327476B1 KR 1019950031678 A KR1019950031678 A KR 1019950031678A KR 19950031678 A KR19950031678 A KR 19950031678A KR 100327476 B1 KR100327476 B1 KR 100327476B1
Authority
KR
South Korea
Prior art keywords
lsp
frequency
vector
quantization
formant
Prior art date
Application number
KR1019950031678A
Other languages
English (en)
Other versions
KR970019123A (ko
Inventor
김무영
오기은
Original Assignee
삼성전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자 주식회사 filed Critical 삼성전자 주식회사
Priority to KR1019950031678A priority Critical patent/KR100327476B1/ko
Publication of KR970019123A publication Critical patent/KR970019123A/ko
Application granted granted Critical
Publication of KR100327476B1 publication Critical patent/KR100327476B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0011Long term prediction filters, i.e. pitch estimation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

디지털 음성 부호화 방법에 관한 것으로서 더욱 상세하게는 선스펙트럼쌍의 크기에 따라 코드북을 분류하고 포만트 근처의 선스펙트럼쌍에 더 많은 비트를 할당하는 개선된 선형 예측 부호화 방법이 개시된다.
본 발명에 따른 분할 선스펙트럼쌍 벡터 양자화 방법은 LSP벡터의 포만트 주파수를 구하고, N개의 LSP주파수를 포만트 주파수의 인접도에 따라 양자화비트수를 달리하여 양자화하는 과정; 첫 번째 LSP주파수의 크기에 따라 상기 양자화된 LSP벡터를 분류하는 과정; 및 분류되고 양자화된 LSP벡터를 M개의 부분집합으로 분할하여 부호화하는 과정을 포함함을 특징으로 한다.
본 발명에 따른 벡터 양자화 방법에서는 코드북을 8가지로 분할함으로써 탐색 공간을 줄여 학습할 때와 양자화할 때의 속도를 빠르게 할 수 있다는 효과를 갖는다.

Description

분할 선스펙트럼쌍의 벡터 양자화 방법
본 발명은 디지털 음성 부호화 방법에 관한 것으로서 더욱 상세하게는 선스펙트럼쌍의 크기에 따라 코드북을 분류하고 포만트 근처의 선스펙트럼쌍에 더 많은 비트를 할당하는 개선된 분할 선스펙트럼쌍 벡터 양자화 방법에 관한 것이다.
디지털 음성 부호화 분야에서 음질의 저하없이 보다 적은 전송률로 음성신호를 표현하고자 하는 노력이 지속되고 있다. 특히, 4.8Kbits/s이하의 저전송률 선형 예측 부호화(Linear Predictive Coding:이하 LPC라 함)에 기초하는 부호화기에 LPC스펙트럼에 대한 정보의 효율적 표현은 전송 품질의 유지 및 적은 전송률의 달성에 있어서 중요한 역할을 한다.
전송률 축소를 위해서 LPC스펙트럼을 벡터 양자화하는 방법이 다각도로 연구되어 왔다. 이중에서 분할 LSP 벡터 양자화(split-LSPVQ)는 프레임 당 24bit로 LSP계수를 1dB이하의 스펙트럼 왜곡을 가지면서 표현하는 방법이다. LSP(Line Spectral Pair)는 LPC스펙트럼을 표현하는 가장 대표적인 방법이다.
분할 LSP 벡터 양자화 방법(split-LSP Vector Quntizing)에서는 LSP계수를 차수별로 나누어 코드북을 형성함으로써, 같은 비트 수의 다른 VQ에 비해 더 좋은 성능을 나타낼 수 있다는 장점이 있지만 그에 반해 많은 계산량이 요구된다는 단점이 있다.
또한, split-LSP VQ에서는 i번째 프레임의 LSP주파수를 M개의 부분집합으로 나누어, 각각의 부분집합마다 다른 종류의 코드북으로 코드화한다. 차수(order)는 10이고, M은 2이며 각 부분집합마다 같은 비트 수를 할당할 경우 LSP주파수는 (f1,f2,f3,f4),(f5,f6,f7,f8,f9,f10)와 같이 나누어진다. 이렇게 2단계로 나누는 근거는 저주파수 쪽의 LSP계수가 고주파수 쪽의 LSP계수보다 중요하기 때문이다.
그렇지만 이 경우 파워 스펙트럼(power spectrum)의 포만트 근처의 LSP주파수가 다른 위치의 LSP주파수보다 더 중요하다는 사실은 반영되어져 있지 않다.
본 발명은 상기의 문제점을 해결하기 위해 창출된 것으로서 계산량이 감소되고, 포만트 근처의 LSP주파수의 중요도를 반영시킨 개선된 벡터 양자화 방법을 제공하는 것을 그 목적으로 한다.
본 발명의 다른 목적은 상기의 벡터 양자화 방법에 적용되는 코드북을 작성하는 방법을 제공함에 있다.
상기의 목적을 달성하는 본 발명에 따른 LSP계수의 벡터 양자화 방법은
N개의 주파수 성분을 갖는 LSP벡터를 M개의 부분집합으로 나누어 양자화하는 분할-선스펙트럼쌍 벡터 양자화 방법에 있어서,
상기 LSP벡터의 포만트 주파수를 구하고, N개의 LSP주파수를 포만트 주파수의 인접도에 따라 양자화 비트 수를 달리하여 양자화하는 과정:
첫 번째 LSP주파수의 크기에 따라 상기 양자화된 LSP벡터를 분류하는 과정,
분류되고 양자화된 LSP벡터를 M개의 부분집합으로 분할하여 부호화하는 과정을 포함함을 특징으로 한다.
상기의 목적을 달성하는 본 발명에 따른 LSP벡터의 벡터 양자화에 사용되는 코드북의 작성 방법은
L개의 샘플 LSP벡터를 첫 번째 LSP주파수의 크기 분포에 따라 분류하는 과정;
상기 분류된 LSP벡터에 포함된 각각의 LSP주파수를 포만트 주파수에의 인접도에 따라 양자와 비트 수를 달리하여 양자화하는 과정;
클래스별로 분류되고 양자화된 LSP벡터를 정렬시키고 인덱스 부호를 대응시키는 과정을 포함함을 특징으로 한다. 이하 첨부된 도면을 참조하여 본 발명을 상세히 설명한다.
제1도는 본 발명에 따른 벡터 양자화 방법을 보이는 흐름도이다.
제1도에 도시된 흐름도는 LSP벡터의 양자화 과정(100단계), LSP벡터의 분류과정(120단계), 부호화 과정(140단계), 인덱스 전송과정 (160단계)을 구비한다.
양자화 과정(100단계)에서는 LSP벡터를 구성하는 N개의 LSP주파수를 포만트 주파수의 인접도에 따라 양자화한다. 본 발명에 따른 split-LSP VQ에서는 VQ의 성능 향상을 위해 포만트 주파수 근처의 LSP주파수에 더 많은 양자화 비트 수를 할당한다. 여기서, 양자화 비트 수는 코드북인덱스의 비트 수에 상당한다.
개시된 실시 예에 있어서는 첫 번째와 두 번째 포만트 주파수 근처의 LSP주파수에 더 많은 비트를 할당한다. 왜냐하면 포만트 주파수 근처의 LSP주파수는 다른 LSP주파수보다 전송 품질에 영향을 주기 때문이다.
예를 들어, 10차의 LSP벡터에 코드북 인덱스로 24비트를 할당한다면,
(1) 첫 번째 포만트 부근의 2개 LSP주파수에 7bit를 할당하고,
(2) 두 번째 포만트 주파수 근처의 2개 LSP주파수에 6비트를 할당하고,
(3) (f1,f2,f3,f4,f5,f6,f7)중 (1)이나 (2)에 포함되지 않은 3개의 LSP주파수에 6비트를 할당하고,
(4) (f8,f9,f10)의 3개 LSP주파수에 5bit를 할당한다.
LSP벡터의 분류 과정(120단계)에서는 LSP벡터의 첫 번째 LSP주파수의 크기에 따라 LSP벡터를 분류하고, 어느 코드북을 이용할지를 결정해 그 인덱스(index i)를 결정하여 140단계로 넘겨준다.
부호화 과정(140단계)에서는 양자화 과정(100단계)에서 얻어진 LSP벡터와 가장 유사한 LSP벡터의 코드워드를 분류 과정(120단계)에서 결정된 코드북에서 탐색하고, 그 인덱스(index j)를 출력한다.
두개의 인덱스 index i, j는 비트 열로 형성되어 복호화기(제4도)로 전송된다.(160단계)
제2도는 본 발명에 따른 코드북 형성 과정을 보이는 흐름도이다. 제2도에 도시된 흐름도는 L개의 샘플 LSP벡터를 첫 번째 LSP주파수의 크기에 따라 분류하는 과정(200단계), 분류된 LSP벡터에 포함된 각각의 LSP주파수를 포만트 주파수에의 인접도에 따라 양자화 비트 수를 달리하여 양자화하는 과정(220단계), 클래스별로 분류되고 앙자화된 LSP벡터를 정렬시키고 인덱스 부호를 대응시키는 과정(240단계)을 포함한다.
200단계는 각 LSP벡터를 첫 번째 LSP주파수의 크기 분포에 따라 Q개의 클래스로 분류한다. 표1은 남성 화자의 LSP주파수 분포 범위를 보이는 것이고, 표2는 여성 화자의 LSP주파수 분포 범위를 보이는 것이고, 표3은 남성 화자와 여성 화자를 함께 고려했을 때의 주파수 분포범위를 보이는 것이다.
<표 1>
<표 2>
<표 3>
표3에 의하면 첫 번째 LSP주파수 f1의 상한과 하한의 차이가 가장 적으므로 첫 번째 LSP주파수를 대상으로 분류하였을 때 가장 자세하게 분석할 수 있음을 알 수 있다.
표1에 의하면 첫 번째 LSP주파수의 경우 0.11 - 0.51㎑의 주파수분포 범위를 찾게 되며, 이 구간에서 LSP주파수의 분포곡선을 보면 제3도와 같이 균일하지 않게 된다.
따라서, 주파수 구간을 Q개의 클래스로 나눌 때 동일한 길이로 분할하기보다는 분포가 자주 일어나는 곳은 좀 더 촘촘하게 분할하는 것이 타당하다. 본 발명에서는 학습 데이터의 종류에 따라 가변하며 주파수 구간을 분할하여 Q가지의 코드북을 만드는 방법을 제안한다.
L개의 N-order LSP벡터가 입력되고, i번째 LSP벡터의 첫 번째 LSP주파수를 f1 (i)이라고 하면,
진행하면서 한 클래스에 L/Q개의 N-order LSP벡터가 저장될 수 있도록 주파수 구간을 Q개로 분할한다.
3rd step: 분할된 Q개의 주파수 구간에 따라 Q가지의 코드북을 만든다.
제4도는 본 발명에 따라 부호화되어 전송된 비트열로부터 LSP벡터를 복호화하는 과정을 보이는 흐름도이다. 먼저 300단계에서는 부호화기(제1도)에서 전송된 비트열을 수신한다. 320단계에서는 수신한 비트열의 초기 3비트를 이용하여 8가지의 코드북 중에서 어느 코드북을 이용할 지에 관련된 인덱스를 복원하고, 나머지 비트들을 이용하여 해당 코드북 내의 어떤 부호워드(code word)를 결정하는 인덱스를 복원한다. 340단계에서는 10-order LSP벡터를 최종적으로 복원한다.
상술한 바와 같이 본 발명에 따른 벡터 양자화 방법에서는 코드북을 Q가지로 분할함으로써 탐색 공간을 줄여 학습할 때와 양자화할 때의 속도를 빠르게 할 수 있다는 효과를 갖는다.
제1도는 본 발명에 따른 양자화 방법을 보이는 흐름도이다.
제2도는 본 발명에 따른 코드북 작성 방법을 보이는 흐름도이다.
제3도는 LSP벡터의 첫 번째 LSP주파수의 발생 빈도를 보이는 분포도이다.
제4도는 제1도에 도시된 양자화 방법에 대응되는 복호화 방법을 보이는 흐름도이다.

Claims (6)

  1. N개의 주파수 성분을 갖는 LSP벡터를 M개의 부분집합으로 나누어 양자화하는 분할-선스펙트럼쌍 벡터 양자화 방법에 있어서,
    상기 LSP벡터의 포만트 주파수를 구하고, N개의 LSP주파수를 포만트 주파수의 인접도에 따라 양자화 비트 수를 달리하여 양자화하는 과정:
    첫 번째 LSP주파수의 크기에 따라 상기 양자화된 LSP벡터를 분류하는 과정; 및
    분류되고 양자화된 LSP벡터를 M개의 부분집합으로 분할하여 부호화하는 과정을 포함하는 분할 선스펙트럼쌍의 벡터 양자화 방법.
  2. 제1항에 있어서, 상기 양자화 과정은 포만트 주파수에 인접된 LSP주파수의 양자화 비트 수가 다른 것에 비해 큰 것을 특징으로 하는 분할 선스펙트럼쌍의 벡터 양자화 방법.
  3. 제2항에 있어서, 상기 양자화 과정은 포만트 주파수의 순서에 따라 양자화 비트 수가 적어짐을 특징으로 하는 분할 선스펙트럼쌍의 벡터 양자화 방법.
  4. 제1항에 있어서, 상기 부호화 과정에 있어서 분할되는 부분집합의 수는 2이며, 저주파수 쪽의 부분집합에 포함되는 LSP주파수의 개수가 고주파수 쪽의 부분집합에 포함되는 LSP주파수의 개수보다 큰것을 특징으로 하는 분할 선스펙트럼쌍의 벡터 양자화 방법.
  5. LSP벡터의 벡터 양자화에 사용되는 코드북의 작성 방법에 있어서,
    L개의 샘플 LSP벡터를 첫 번째 LSP주파수의 크기 분포에 따라 분류하는 과정:
    상기 분류된 LSP벡터에 포함된 각각의 LSP주파수를 포만트 주파수에의 인접도에 따라 양자화비트수를 달리하여 양자화하는 과정;
    클래스별로 분류되고 양자화된 LSP벡터를 정렬시키고 인덱스 부호를 대응시키는 과정을 포함하는 코드북의 작성 방법.
  6. 제5항에 있어서, 상기 분류 과정은 분류된 각 클래스에 있어서 첫 번째 LSP주파수의 분포도가 균일하게 되도록 분류함을 특징으로 하는 코드북의 작성 방법.
KR1019950031678A 1995-09-25 1995-09-25 분할선스펙트럼쌍의벡터양자화방법 KR100327476B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019950031678A KR100327476B1 (ko) 1995-09-25 1995-09-25 분할선스펙트럼쌍의벡터양자화방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019950031678A KR100327476B1 (ko) 1995-09-25 1995-09-25 분할선스펙트럼쌍의벡터양자화방법

Publications (2)

Publication Number Publication Date
KR970019123A KR970019123A (ko) 1997-04-30
KR100327476B1 true KR100327476B1 (ko) 2002-07-27

Family

ID=37478414

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019950031678A KR100327476B1 (ko) 1995-09-25 1995-09-25 분할선스펙트럼쌍의벡터양자화방법

Country Status (1)

Country Link
KR (1) KR100327476B1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100324204B1 (ko) * 1999-12-24 2002-02-16 오길록 예측분할벡터양자화 및 예측분할행렬양자화 방식에 의한선스펙트럼쌍 양자화기의 고속탐색방법
KR100316304B1 (ko) * 2000-01-14 2001-12-12 대표이사 서승모 음성 부호화기의 lsp 코드북을 위한 고속탐색 방법

Also Published As

Publication number Publication date
KR970019123A (ko) 1997-04-30

Similar Documents

Publication Publication Date Title
US9171550B2 (en) Context-based arithmetic encoding apparatus and method and context-based arithmetic decoding apparatus and method
US7433824B2 (en) Entropy coding by adapting coding between level and run-length/level modes
US8712783B2 (en) Entropy encoding and decoding using direct level and run-length/level context-adaptive arithmetic coding/decoding modes
EP2991075A2 (en) Speech coding method, speech decoding method, speech coding apparatus and speech decoding apparatus
KR20080049116A (ko) 오디오 코딩
EP1595248B1 (en) System and method for enhancing bit error tolerance over a bandwith limited channel
KR100322706B1 (ko) 선형예측부호화계수의부호화및복호화방법
US5651026A (en) Robust vector quantization of line spectral frequencies
EP2087485B1 (en) Multicodebook source -dependent coding and decoding
KR100327476B1 (ko) 분할선스펙트럼쌍의벡터양자화방법
KR100188912B1 (ko) 서브밴드코딩의 비트재할당 방법
Mohammadi et al. Low cost vector quantization methods for spectral coding in low rate speech coders
KR960015861B1 (ko) 선 스펙트럼 주파수 벡터의 양자화 방법 및 양자화기
JPH0761044B2 (ja) 音声符号化法
KR100446595B1 (ko) 국소화특성을이용한선스펙트럼주파수의벡터양자화방법
Xydeas et al. A long history quantization approach to scalar and vector quantization of LSP coefficients
KR100300963B1 (ko) 연결스칼라양자화기
Bouzid et al. Multi-coder vector quantizer for transparent coding of wideband speech ISF parameters
Wong et al. Voice coding at 800 bps and lower data rates with LPC vector quantization
KR100322702B1 (ko) 스펙트럼피크패턴을이용한음성신호의양자화및복호화방법
JPH09120300A (ja) ベクトル量子化装置
JP2683734B2 (ja) 音声符号化法
Rodríguez Fonollosa et al. Robust LPC vector quantization based on Kohonen's design algorithm
EP0755047A2 (en) Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits
Jahangiri et al. Scalable speech coding at rates below 900 BPS

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20080115

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee