KR100327476B1 - 분할선스펙트럼쌍의벡터양자화방법 - Google Patents
분할선스펙트럼쌍의벡터양자화방법 Download PDFInfo
- Publication number
- KR100327476B1 KR100327476B1 KR1019950031678A KR19950031678A KR100327476B1 KR 100327476 B1 KR100327476 B1 KR 100327476B1 KR 1019950031678 A KR1019950031678 A KR 1019950031678A KR 19950031678 A KR19950031678 A KR 19950031678A KR 100327476 B1 KR100327476 B1 KR 100327476B1
- Authority
- KR
- South Korea
- Prior art keywords
- lsp
- frequency
- vector
- quantization
- formant
- Prior art date
Links
- 239000013598 vector Substances 0.000 title claims abstract description 57
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000013139 quantization Methods 0.000 title claims abstract description 37
- 238000001228 spectrum Methods 0.000 title claims abstract description 19
- 230000007423 decrease Effects 0.000 claims 1
- 238000004364 calculation method Methods 0.000 abstract description 2
- 230000005540 biological transmission Effects 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 2
- 230000000593 degrading effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0011—Long term prediction filters, i.e. pitch estimation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
디지털 음성 부호화 방법에 관한 것으로서 더욱 상세하게는 선스펙트럼쌍의 크기에 따라 코드북을 분류하고 포만트 근처의 선스펙트럼쌍에 더 많은 비트를 할당하는 개선된 선형 예측 부호화 방법이 개시된다.
본 발명에 따른 분할 선스펙트럼쌍 벡터 양자화 방법은 LSP벡터의 포만트 주파수를 구하고, N개의 LSP주파수를 포만트 주파수의 인접도에 따라 양자화비트수를 달리하여 양자화하는 과정; 첫 번째 LSP주파수의 크기에 따라 상기 양자화된 LSP벡터를 분류하는 과정; 및 분류되고 양자화된 LSP벡터를 M개의 부분집합으로 분할하여 부호화하는 과정을 포함함을 특징으로 한다.
본 발명에 따른 벡터 양자화 방법에서는 코드북을 8가지로 분할함으로써 탐색 공간을 줄여 학습할 때와 양자화할 때의 속도를 빠르게 할 수 있다는 효과를 갖는다.
Description
본 발명은 디지털 음성 부호화 방법에 관한 것으로서 더욱 상세하게는 선스펙트럼쌍의 크기에 따라 코드북을 분류하고 포만트 근처의 선스펙트럼쌍에 더 많은 비트를 할당하는 개선된 분할 선스펙트럼쌍 벡터 양자화 방법에 관한 것이다.
디지털 음성 부호화 분야에서 음질의 저하없이 보다 적은 전송률로 음성신호를 표현하고자 하는 노력이 지속되고 있다. 특히, 4.8Kbits/s이하의 저전송률 선형 예측 부호화(Linear Predictive Coding:이하 LPC라 함)에 기초하는 부호화기에 LPC스펙트럼에 대한 정보의 효율적 표현은 전송 품질의 유지 및 적은 전송률의 달성에 있어서 중요한 역할을 한다.
전송률 축소를 위해서 LPC스펙트럼을 벡터 양자화하는 방법이 다각도로 연구되어 왔다. 이중에서 분할 LSP 벡터 양자화(split-LSPVQ)는 프레임 당 24bit로 LSP계수를 1dB이하의 스펙트럼 왜곡을 가지면서 표현하는 방법이다. LSP(Line Spectral Pair)는 LPC스펙트럼을 표현하는 가장 대표적인 방법이다.
분할 LSP 벡터 양자화 방법(split-LSP Vector Quntizing)에서는 LSP계수를 차수별로 나누어 코드북을 형성함으로써, 같은 비트 수의 다른 VQ에 비해 더 좋은 성능을 나타낼 수 있다는 장점이 있지만 그에 반해 많은 계산량이 요구된다는 단점이 있다.
또한, split-LSP VQ에서는 i번째 프레임의 LSP주파수를 M개의 부분집합으로 나누어, 각각의 부분집합마다 다른 종류의 코드북으로 코드화한다. 차수(order)는 10이고, M은 2이며 각 부분집합마다 같은 비트 수를 할당할 경우 LSP주파수는 (f1,f2,f3,f4),(f5,f6,f7,f8,f9,f10)와 같이 나누어진다. 이렇게 2단계로 나누는 근거는 저주파수 쪽의 LSP계수가 고주파수 쪽의 LSP계수보다 중요하기 때문이다.
그렇지만 이 경우 파워 스펙트럼(power spectrum)의 포만트 근처의 LSP주파수가 다른 위치의 LSP주파수보다 더 중요하다는 사실은 반영되어져 있지 않다.
본 발명은 상기의 문제점을 해결하기 위해 창출된 것으로서 계산량이 감소되고, 포만트 근처의 LSP주파수의 중요도를 반영시킨 개선된 벡터 양자화 방법을 제공하는 것을 그 목적으로 한다.
본 발명의 다른 목적은 상기의 벡터 양자화 방법에 적용되는 코드북을 작성하는 방법을 제공함에 있다.
상기의 목적을 달성하는 본 발명에 따른 LSP계수의 벡터 양자화 방법은
N개의 주파수 성분을 갖는 LSP벡터를 M개의 부분집합으로 나누어 양자화하는 분할-선스펙트럼쌍 벡터 양자화 방법에 있어서,
상기 LSP벡터의 포만트 주파수를 구하고, N개의 LSP주파수를 포만트 주파수의 인접도에 따라 양자화 비트 수를 달리하여 양자화하는 과정:
첫 번째 LSP주파수의 크기에 따라 상기 양자화된 LSP벡터를 분류하는 과정,
분류되고 양자화된 LSP벡터를 M개의 부분집합으로 분할하여 부호화하는 과정을 포함함을 특징으로 한다.
상기의 목적을 달성하는 본 발명에 따른 LSP벡터의 벡터 양자화에 사용되는 코드북의 작성 방법은
L개의 샘플 LSP벡터를 첫 번째 LSP주파수의 크기 분포에 따라 분류하는 과정;
상기 분류된 LSP벡터에 포함된 각각의 LSP주파수를 포만트 주파수에의 인접도에 따라 양자와 비트 수를 달리하여 양자화하는 과정;
클래스별로 분류되고 양자화된 LSP벡터를 정렬시키고 인덱스 부호를 대응시키는 과정을 포함함을 특징으로 한다. 이하 첨부된 도면을 참조하여 본 발명을 상세히 설명한다.
제1도는 본 발명에 따른 벡터 양자화 방법을 보이는 흐름도이다.
제1도에 도시된 흐름도는 LSP벡터의 양자화 과정(100단계), LSP벡터의 분류과정(120단계), 부호화 과정(140단계), 인덱스 전송과정 (160단계)을 구비한다.
양자화 과정(100단계)에서는 LSP벡터를 구성하는 N개의 LSP주파수를 포만트 주파수의 인접도에 따라 양자화한다. 본 발명에 따른 split-LSP VQ에서는 VQ의 성능 향상을 위해 포만트 주파수 근처의 LSP주파수에 더 많은 양자화 비트 수를 할당한다. 여기서, 양자화 비트 수는 코드북인덱스의 비트 수에 상당한다.
개시된 실시 예에 있어서는 첫 번째와 두 번째 포만트 주파수 근처의 LSP주파수에 더 많은 비트를 할당한다. 왜냐하면 포만트 주파수 근처의 LSP주파수는 다른 LSP주파수보다 전송 품질에 영향을 주기 때문이다.
예를 들어, 10차의 LSP벡터에 코드북 인덱스로 24비트를 할당한다면,
(1) 첫 번째 포만트 부근의 2개 LSP주파수에 7bit를 할당하고,
(2) 두 번째 포만트 주파수 근처의 2개 LSP주파수에 6비트를 할당하고,
(3) (f1,f2,f3,f4,f5,f6,f7)중 (1)이나 (2)에 포함되지 않은 3개의 LSP주파수에 6비트를 할당하고,
(4) (f8,f9,f10)의 3개 LSP주파수에 5bit를 할당한다.
LSP벡터의 분류 과정(120단계)에서는 LSP벡터의 첫 번째 LSP주파수의 크기에 따라 LSP벡터를 분류하고, 어느 코드북을 이용할지를 결정해 그 인덱스(index i)를 결정하여 140단계로 넘겨준다.
부호화 과정(140단계)에서는 양자화 과정(100단계)에서 얻어진 LSP벡터와 가장 유사한 LSP벡터의 코드워드를 분류 과정(120단계)에서 결정된 코드북에서 탐색하고, 그 인덱스(index j)를 출력한다.
두개의 인덱스 index i, j는 비트 열로 형성되어 복호화기(제4도)로 전송된다.(160단계)
제2도는 본 발명에 따른 코드북 형성 과정을 보이는 흐름도이다. 제2도에 도시된 흐름도는 L개의 샘플 LSP벡터를 첫 번째 LSP주파수의 크기에 따라 분류하는 과정(200단계), 분류된 LSP벡터에 포함된 각각의 LSP주파수를 포만트 주파수에의 인접도에 따라 양자화 비트 수를 달리하여 양자화하는 과정(220단계), 클래스별로 분류되고 앙자화된 LSP벡터를 정렬시키고 인덱스 부호를 대응시키는 과정(240단계)을 포함한다.
200단계는 각 LSP벡터를 첫 번째 LSP주파수의 크기 분포에 따라 Q개의 클래스로 분류한다. 표1은 남성 화자의 LSP주파수 분포 범위를 보이는 것이고, 표2는 여성 화자의 LSP주파수 분포 범위를 보이는 것이고, 표3은 남성 화자와 여성 화자를 함께 고려했을 때의 주파수 분포범위를 보이는 것이다.
<표 1>
<표 2>
<표 3>
표3에 의하면 첫 번째 LSP주파수 f1의 상한과 하한의 차이가 가장 적으므로 첫 번째 LSP주파수를 대상으로 분류하였을 때 가장 자세하게 분석할 수 있음을 알 수 있다.
표1에 의하면 첫 번째 LSP주파수의 경우 0.11 - 0.51㎑의 주파수분포 범위를 찾게 되며, 이 구간에서 LSP주파수의 분포곡선을 보면 제3도와 같이 균일하지 않게 된다.
따라서, 주파수 구간을 Q개의 클래스로 나눌 때 동일한 길이로 분할하기보다는 분포가 자주 일어나는 곳은 좀 더 촘촘하게 분할하는 것이 타당하다. 본 발명에서는 학습 데이터의 종류에 따라 가변하며 주파수 구간을 분할하여 Q가지의 코드북을 만드는 방법을 제안한다.
L개의 N-order LSP벡터가 입력되고, i번째 LSP벡터의 첫 번째 LSP주파수를 f1 (i)이라고 하면,
진행하면서 한 클래스에 L/Q개의 N-order LSP벡터가 저장될 수 있도록 주파수 구간을 Q개로 분할한다.
3rd step: 분할된 Q개의 주파수 구간에 따라 Q가지의 코드북을 만든다.
제4도는 본 발명에 따라 부호화되어 전송된 비트열로부터 LSP벡터를 복호화하는 과정을 보이는 흐름도이다. 먼저 300단계에서는 부호화기(제1도)에서 전송된 비트열을 수신한다. 320단계에서는 수신한 비트열의 초기 3비트를 이용하여 8가지의 코드북 중에서 어느 코드북을 이용할 지에 관련된 인덱스를 복원하고, 나머지 비트들을 이용하여 해당 코드북 내의 어떤 부호워드(code word)를 결정하는 인덱스를 복원한다. 340단계에서는 10-order LSP벡터를 최종적으로 복원한다.
상술한 바와 같이 본 발명에 따른 벡터 양자화 방법에서는 코드북을 Q가지로 분할함으로써 탐색 공간을 줄여 학습할 때와 양자화할 때의 속도를 빠르게 할 수 있다는 효과를 갖는다.
제1도는 본 발명에 따른 양자화 방법을 보이는 흐름도이다.
제2도는 본 발명에 따른 코드북 작성 방법을 보이는 흐름도이다.
제3도는 LSP벡터의 첫 번째 LSP주파수의 발생 빈도를 보이는 분포도이다.
제4도는 제1도에 도시된 양자화 방법에 대응되는 복호화 방법을 보이는 흐름도이다.
Claims (6)
- N개의 주파수 성분을 갖는 LSP벡터를 M개의 부분집합으로 나누어 양자화하는 분할-선스펙트럼쌍 벡터 양자화 방법에 있어서,상기 LSP벡터의 포만트 주파수를 구하고, N개의 LSP주파수를 포만트 주파수의 인접도에 따라 양자화 비트 수를 달리하여 양자화하는 과정:첫 번째 LSP주파수의 크기에 따라 상기 양자화된 LSP벡터를 분류하는 과정; 및분류되고 양자화된 LSP벡터를 M개의 부분집합으로 분할하여 부호화하는 과정을 포함하는 분할 선스펙트럼쌍의 벡터 양자화 방법.
- 제1항에 있어서, 상기 양자화 과정은 포만트 주파수에 인접된 LSP주파수의 양자화 비트 수가 다른 것에 비해 큰 것을 특징으로 하는 분할 선스펙트럼쌍의 벡터 양자화 방법.
- 제2항에 있어서, 상기 양자화 과정은 포만트 주파수의 순서에 따라 양자화 비트 수가 적어짐을 특징으로 하는 분할 선스펙트럼쌍의 벡터 양자화 방법.
- 제1항에 있어서, 상기 부호화 과정에 있어서 분할되는 부분집합의 수는 2이며, 저주파수 쪽의 부분집합에 포함되는 LSP주파수의 개수가 고주파수 쪽의 부분집합에 포함되는 LSP주파수의 개수보다 큰것을 특징으로 하는 분할 선스펙트럼쌍의 벡터 양자화 방법.
- LSP벡터의 벡터 양자화에 사용되는 코드북의 작성 방법에 있어서,L개의 샘플 LSP벡터를 첫 번째 LSP주파수의 크기 분포에 따라 분류하는 과정:상기 분류된 LSP벡터에 포함된 각각의 LSP주파수를 포만트 주파수에의 인접도에 따라 양자화비트수를 달리하여 양자화하는 과정;클래스별로 분류되고 양자화된 LSP벡터를 정렬시키고 인덱스 부호를 대응시키는 과정을 포함하는 코드북의 작성 방법.
- 제5항에 있어서, 상기 분류 과정은 분류된 각 클래스에 있어서 첫 번째 LSP주파수의 분포도가 균일하게 되도록 분류함을 특징으로 하는 코드북의 작성 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019950031678A KR100327476B1 (ko) | 1995-09-25 | 1995-09-25 | 분할선스펙트럼쌍의벡터양자화방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019950031678A KR100327476B1 (ko) | 1995-09-25 | 1995-09-25 | 분할선스펙트럼쌍의벡터양자화방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR970019123A KR970019123A (ko) | 1997-04-30 |
KR100327476B1 true KR100327476B1 (ko) | 2002-07-27 |
Family
ID=37478414
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019950031678A KR100327476B1 (ko) | 1995-09-25 | 1995-09-25 | 분할선스펙트럼쌍의벡터양자화방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100327476B1 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100324204B1 (ko) * | 1999-12-24 | 2002-02-16 | 오길록 | 예측분할벡터양자화 및 예측분할행렬양자화 방식에 의한선스펙트럼쌍 양자화기의 고속탐색방법 |
KR100316304B1 (ko) * | 2000-01-14 | 2001-12-12 | 대표이사 서승모 | 음성 부호화기의 lsp 코드북을 위한 고속탐색 방법 |
-
1995
- 1995-09-25 KR KR1019950031678A patent/KR100327476B1/ko not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
KR970019123A (ko) | 1997-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9171550B2 (en) | Context-based arithmetic encoding apparatus and method and context-based arithmetic decoding apparatus and method | |
US7433824B2 (en) | Entropy coding by adapting coding between level and run-length/level modes | |
US8712783B2 (en) | Entropy encoding and decoding using direct level and run-length/level context-adaptive arithmetic coding/decoding modes | |
EP2991075A2 (en) | Speech coding method, speech decoding method, speech coding apparatus and speech decoding apparatus | |
KR20080049116A (ko) | 오디오 코딩 | |
EP1595248B1 (en) | System and method for enhancing bit error tolerance over a bandwith limited channel | |
KR100322706B1 (ko) | 선형예측부호화계수의부호화및복호화방법 | |
US5651026A (en) | Robust vector quantization of line spectral frequencies | |
EP2087485B1 (en) | Multicodebook source -dependent coding and decoding | |
KR100327476B1 (ko) | 분할선스펙트럼쌍의벡터양자화방법 | |
KR100188912B1 (ko) | 서브밴드코딩의 비트재할당 방법 | |
Mohammadi et al. | Low cost vector quantization methods for spectral coding in low rate speech coders | |
KR960015861B1 (ko) | 선 스펙트럼 주파수 벡터의 양자화 방법 및 양자화기 | |
JPH0761044B2 (ja) | 音声符号化法 | |
KR100446595B1 (ko) | 국소화특성을이용한선스펙트럼주파수의벡터양자화방법 | |
Xydeas et al. | A long history quantization approach to scalar and vector quantization of LSP coefficients | |
KR100300963B1 (ko) | 연결스칼라양자화기 | |
Bouzid et al. | Multi-coder vector quantizer for transparent coding of wideband speech ISF parameters | |
Wong et al. | Voice coding at 800 bps and lower data rates with LPC vector quantization | |
KR100322702B1 (ko) | 스펙트럼피크패턴을이용한음성신호의양자화및복호화방법 | |
JPH09120300A (ja) | ベクトル量子化装置 | |
JP2683734B2 (ja) | 音声符号化法 | |
Rodríguez Fonollosa et al. | Robust LPC vector quantization based on Kohonen's design algorithm | |
EP0755047A2 (en) | Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits | |
Jahangiri et al. | Scalable speech coding at rates below 900 BPS |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20080115 Year of fee payment: 7 |
|
LAPS | Lapse due to unpaid annual fee |