KR100446630B1 - 음성신호에 대한 벡터 양자화 및 역 벡터 양자화 장치와그 방법 - Google Patents
음성신호에 대한 벡터 양자화 및 역 벡터 양자화 장치와그 방법 Download PDFInfo
- Publication number
- KR100446630B1 KR100446630B1 KR10-2002-0025401A KR20020025401A KR100446630B1 KR 100446630 B1 KR100446630 B1 KR 100446630B1 KR 20020025401 A KR20020025401 A KR 20020025401A KR 100446630 B1 KR100446630 B1 KR 100446630B1
- Authority
- KR
- South Korea
- Prior art keywords
- klt
- codebook
- speech signal
- vector quantization
- vector
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0004—Design or structure of the codebook
- G10L2019/0005—Multi-stage vector quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0007—Codebook element generation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
Abstract
Description
Claims (17)
- 음성신호에 대한 벡터 양자화 장치에 있어서,KLT(Karhunen-Transform)에 의해 얻어진 음성신호에 대한 코드 벡터를 저장한 코드북을 상기 KLT 도메인 통계치에 따라 복수 개로 분할하여 구비하는 코드북 군;입력되는 음성신호를 KLT 도메인으로 변환하는 KLT부;상기 KLT부에서 KLT에 의해 얻어진 상기 입력되는 음성신호에 대한 고유값(eigenavlue)을 토대로 상기 코드북 군에서 최적의 코드북을 선택하는 제 1 선택부;상기 제 1 선택부에서 선택된 코드북에 실려 있는 코드 벡터들과 상기 KLT부에서 KLT 도메인으로 변환된 음성 신호간의 왜곡을 토대로 최적의 코드 벡터를 선택하는 제 2 선택부;적어도 상기 최적의 코드 벡터의 인덱스를 상기 입력되는 음성신호에 대한 벡터 양자화 정보로서 전송하는 전송부를 포함하는 벡터 양자화 장치.
- 제 1 항에 있어서, 상기 최적의 코드북은 상기 KLT에 의해 얻어진 음성신호의 공분산 매트릭스의 고유값(eigenvalue)을 토대로 한 신호 클래스(class)와 관련된 것을 특징으로 하는 벡터 양자화 장치.
- 제 1 항에 있어서, 상기 KLT부는,상기 입력되는 음성신호의 선형 예측(LP) 계수들을 구하고,상기 선형 예측 계수들을 토대로 공분산 매트릭스를 구하고,상기 공분산 매트릭스의 고유값들을 계산하고,상기 고유값들에 상응하는 고유벡터 세트를 구하고,상기 고유 벡터 세트를 토대로 단위(unitary) 매트릭스를 구하고,구해진 단위 매트릭스를 이용하여 입력되는 음성신호에 대응되는 KLT 도메인을 얻도록 구성되는 것을 특징으로 하는 벡터 양자화 장치.
- 제 1 항에 있어서, 상기 제 1 선택부는 하기 수학식을 토대로 상기 최적의 코드북을 선택하는 것을 특징으로 하는 벡터 양자화 장치.ε'=(= 입력신호의 i번째 고유값이고,는 j번째 클래스 코드북의 i번째 고유값이다.)
- 제 1 항에 있어서, 상기 제 1 선택부는 상기 KLT부에 의해 계산된 고유값 세트와 근사한 고유값 세트가 할당된 코드북을 상기 최적의 코드북으로 선택하는 것을 특징으로 하는 벡터 양자화 장치.
- 제 1 항에 있어서, 상기 제 2 선택부는 최소 왜곡 값을 갖는 코드 벡터가 최적의 코드 벡터가 되도록 선택하는 것을 특징으로 하는 벡터 양자화 장치.
- 제 1 항에 있어서, 상기 제 2 선택부는 하기 수학식을 토대로 상기 왜곡을검출하는 것을 특징으로 하는 벡터 양자화 장치.
- 제 1 항에 있어서, 상기 전송부는 상기 입력되는 음성신호에 대한 벡터 양자화 정보에 LP 계수를 더 포함시켜 전송하는 것을 특징으로 하는 벡터 양자화 장치.
- 제 1 항에 있어서, 상기 코드북 차원은 KLT의 에너지 집중 특성을 사용하여 서브셋 차원으로 줄일 수 있는 벡터 양자화 장치.
- 제 1 항에 있어서, 상기 벡터 양자화 장치가 이전 프레임에서 양자화된 음성신호를 가지고 현재 프레임의 스펙트럼 특성을 나타내는 LP계수를 추정하도록 구성된 경우에, 상기 전송부가 음성신호에 대한 벡터 양자화 정보로서 LP계수를 전송하지 않도록 구성되는 것을 특징으로 하는 벡터 양자화 장치.
- 음성신호에 대한 코드 벡터가 저장된 복수의 코드북이 구비된 시스템에서 상기 음성신호에 대한 벡터 양자화 방법에 있어서,입력되는 음성신호를 KLT 도메인으로 변환하는 단계;상기 KLT 도메인으로 변환함에 따라 추정된 상기 입력되는 음성신호에 대한 고유값 세트를 토대로 상기 복수의 코드북에서 최적의 코드북을 선택하는 단계;선택된 코드북에 저장되어 있는 코드 벡터들과 KLT 도메인으로 변환된 음성신호간의 왜곡 값을 토대로 최적의 코드 벡터를 선택하는 단계;선택된 코드 벡터의 인덱스를 상기 입력되는 음성신호에 대응되는 벡터 양자화 값으로서 전송하는 단계를 포함하는 벡터 양자화 방법.
- 제 11 항에 있어서, 상기 변환단계는상기 입력되는 음성신호에 대한 선형 예측 계수를 추정하는 단계;상기 입력되는 음성신호에 대한 공분산 매트릭스를 구하는 단계;상기 공분산 매트릭스에 대한 고유값 세트를 구하는 단계;상기 고유값 세트에 대한 고유 벡터 세트를 구하는 단계;상기 고유 벡터 세트를 이용하여 상기 음성신호에 대응되는 단위 매트릭스를 구하는 단계;상기 단위 매트릭스를 이용하여 상기 입력되는 음성신호를 KLT 도메인으로 변환하는 단계를 포함하는 벡터 양자화 방법.
- 제 11 항에 있어서, 상기 코드북 선택단계는 상기 고유값 세트와 근사한 고유값 세트와 관련된 코드북을 최적의 코드북으로 선택하는 벡터 양자화 방법.
- 제 11 항에 있어서, 상기 최적의 코드 벡터 선택 단계는 상기 왜곡이 최소치인 코드벡터를 상기 최적의 코드 벡터로 선택하는 벡터 양자화 방법.
- 제 11 항에 있어서, 상기 코드북 차원은 KLT의 에너지 집중 특성을 사용하여 서브셋 차원으로 줄일 수 있는 벡터 양자화 방법.
- 제 12 항에 있어서, 상기 선형 예측 계수 추정 단계가 이전 프레임에서 양자화된 음성신호를 이용하여 현재 프레임의 스펙트럼 특성을 나타내는 선형 예측 계수를 추정하는 경우에, 상기 전송 단계에서 상기 음성신호에 대한 벡터 양자화 정보로서 LP계수를 전송하지 않는 것을 특징으로 하는 벡터 양자화 방법.
- 음성신호에 대한 역 벡터 양자화 장치에 있어서,KLT(Karhunen-Transform)에 의해 얻어진 음성신호에 대한 코드 벡터를 저장한 코드북을 상기 KLT 도메인 통계치에 따라 복수 개로 분할하여 구비하는 코드북 군;수신되는 데이터를 분석하여 상기 코드 벡터의 인덱스를 검출하고, 현재 프레임의 스펙트럼 특성을 나타내는 선형 예측 계수를 토대로 고유값 세트와 단위 매트릭스(U)를 각각 검출하고, 검출된 코드 벡터의 인텍스와 고유값 세트는 상기 코드북 군으로 출력하는 데이터 검출부;상기 데이터 검출부로부터 출력되는 단위 매트릭스와 상기 코드 벡터의 인덱스에 의해 상기 코드북 군으로부터 출력되는 코드 벡터를 이용한 역 KLT로 상기 코드 벡터에 대응되는 원래의 음성신호를 복원하는 역 KLT부를 포함하는 역 벡터 양자화 장치.
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2002-0025401A KR100446630B1 (ko) | 2002-05-08 | 2002-05-08 | 음성신호에 대한 벡터 양자화 및 역 벡터 양자화 장치와그 방법 |
EP02256142A EP1361567B1 (en) | 2002-05-08 | 2002-09-04 | Vector quantization for a speech transform coder |
DE60232402T DE60232402D1 (de) | 2002-05-08 | 2002-09-04 | Vektorquantisierung für einen Sprach-Transformationskodierer |
US10/234,182 US6631347B1 (en) | 2002-05-08 | 2002-09-05 | Vector quantization and decoding apparatus for speech signals and method thereof |
JP2002376122A JP2004029708A (ja) | 2002-05-08 | 2002-12-26 | 音声信号に対するベクトル量子化及びデコーディング装置とその方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2002-0025401A KR100446630B1 (ko) | 2002-05-08 | 2002-05-08 | 음성신호에 대한 벡터 양자화 및 역 벡터 양자화 장치와그 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20030087373A KR20030087373A (ko) | 2003-11-14 |
KR100446630B1 true KR100446630B1 (ko) | 2004-09-04 |
Family
ID=28673112
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR10-2002-0025401A KR100446630B1 (ko) | 2002-05-08 | 2002-05-08 | 음성신호에 대한 벡터 양자화 및 역 벡터 양자화 장치와그 방법 |
Country Status (5)
Country | Link |
---|---|
US (1) | US6631347B1 (ko) |
EP (1) | EP1361567B1 (ko) |
JP (1) | JP2004029708A (ko) |
KR (1) | KR100446630B1 (ko) |
DE (1) | DE60232402D1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101428938B1 (ko) | 2013-08-19 | 2014-08-08 | 세종대학교산학협력단 | 음성 신호의 벡터 양자화 장치 및 그 방법 |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7296163B2 (en) * | 2000-02-08 | 2007-11-13 | The Trustees Of Dartmouth College | System and methods for encrypted execution of computer programs |
EP2273494A3 (en) * | 2004-09-17 | 2012-11-14 | Panasonic Corporation | Scalable encoding apparatus, scalable decoding apparatus |
US8385433B2 (en) * | 2005-10-27 | 2013-02-26 | Qualcomm Incorporated | Linear precoding for spatially correlated channels |
US8760994B2 (en) | 2005-10-28 | 2014-06-24 | Qualcomm Incorporated | Unitary precoding based on randomized FFT matrices |
KR20090030200A (ko) | 2007-09-19 | 2009-03-24 | 엘지전자 주식회사 | 위상천이 기반의 프리코딩을 이용한 데이터 송수신 방법 및이를 지원하는 송수신기 |
CN101415121B (zh) * | 2007-10-15 | 2010-09-29 | 华为技术有限公司 | 一种自适应的帧预测的方法及装置 |
CN100578619C (zh) * | 2007-11-05 | 2010-01-06 | 华为技术有限公司 | 编码方法和编码器 |
US8077994B2 (en) * | 2008-06-06 | 2011-12-13 | Microsoft Corporation | Compression of MQDF classifier using flexible sub-vector grouping |
JP5425066B2 (ja) * | 2008-06-19 | 2014-02-26 | パナソニック株式会社 | 量子化装置、符号化装置およびこれらの方法 |
KR101056462B1 (ko) * | 2009-07-02 | 2011-08-11 | 세종대학교산학협력단 | 음성신호 양자화 장치 및 방법 |
EP2372699B1 (en) * | 2010-03-02 | 2012-12-19 | Google, Inc. | Coding of audio or video samples using multiple quantizers |
KR101348888B1 (ko) * | 2012-01-04 | 2014-01-09 | 세종대학교산학협력단 | Klt 기반 도메인 스위치 스플릿 벡터 양자화 방법 및 장치 |
KR101413229B1 (ko) * | 2013-05-13 | 2014-08-06 | 한국과학기술원 | 방향 추정 장치 및 방법 |
JP6337122B2 (ja) * | 2013-12-17 | 2018-06-06 | ノキア テクノロジーズ オサケユイチア | オーディオ信号エンコーダ |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4907276A (en) * | 1988-04-05 | 1990-03-06 | The Dsp Group (Israel) Ltd. | Fast search method for vector quantizer communication and pattern recognition systems |
US5506933A (en) * | 1992-03-13 | 1996-04-09 | Kabushiki Kaisha Toshiba | Speech recognition using continuous density hidden markov models and the orthogonalizing karhunen-loeve transformation |
KR19990039267A (ko) * | 1997-11-11 | 1999-06-05 | 정선종 | 신경망을 이용한 영상 데이터 압축/복원 장치의 구조 및압축/복원 방법 |
US20020010581A1 (en) * | 2000-06-19 | 2002-01-24 | Stephan Euler | Voice recognition device |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5544277A (en) * | 1993-07-28 | 1996-08-06 | International Business Machines Corporation | Speech coding apparatus and method for generating acoustic feature vector component values by combining values of the same features for multiple time intervals |
US5621852A (en) * | 1993-12-14 | 1997-04-15 | Interdigital Technology Corporation | Efficient codebook structure for code excited linear prediction coding |
JPH08179796A (ja) * | 1994-12-21 | 1996-07-12 | Sony Corp | 音声符号化方法 |
EP1752968B1 (en) * | 1997-10-22 | 2008-09-10 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus for generating dispersed vectors |
US6151414A (en) * | 1998-01-30 | 2000-11-21 | Lucent Technologies Inc. | Method for signal encoding and feature extraction |
-
2002
- 2002-05-08 KR KR10-2002-0025401A patent/KR100446630B1/ko active IP Right Grant
- 2002-09-04 EP EP02256142A patent/EP1361567B1/en not_active Expired - Lifetime
- 2002-09-04 DE DE60232402T patent/DE60232402D1/de not_active Expired - Lifetime
- 2002-09-05 US US10/234,182 patent/US6631347B1/en not_active Expired - Lifetime
- 2002-12-26 JP JP2002376122A patent/JP2004029708A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4907276A (en) * | 1988-04-05 | 1990-03-06 | The Dsp Group (Israel) Ltd. | Fast search method for vector quantizer communication and pattern recognition systems |
US5506933A (en) * | 1992-03-13 | 1996-04-09 | Kabushiki Kaisha Toshiba | Speech recognition using continuous density hidden markov models and the orthogonalizing karhunen-loeve transformation |
KR19990039267A (ko) * | 1997-11-11 | 1999-06-05 | 정선종 | 신경망을 이용한 영상 데이터 압축/복원 장치의 구조 및압축/복원 방법 |
US20020010581A1 (en) * | 2000-06-19 | 2002-01-24 | Stephan Euler | Voice recognition device |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101428938B1 (ko) | 2013-08-19 | 2014-08-08 | 세종대학교산학협력단 | 음성 신호의 벡터 양자화 장치 및 그 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR20030087373A (ko) | 2003-11-14 |
EP1361567A3 (en) | 2005-06-08 |
EP1361567B1 (en) | 2009-05-20 |
EP1361567A2 (en) | 2003-11-12 |
DE60232402D1 (de) | 2009-07-02 |
US6631347B1 (en) | 2003-10-07 |
JP2004029708A (ja) | 2004-01-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100446630B1 (ko) | 음성신호에 대한 벡터 양자화 및 역 벡터 양자화 장치와그 방법 | |
RU2742199C1 (ru) | Декодер речи, кодер речи, способ декодирования речи, способ кодирования речи, программа декодирования речи и программа кодирования речи | |
US8468017B2 (en) | Multi-stage quantization method and device | |
US6122608A (en) | Method for switched-predictive quantization | |
CA2202825C (en) | Speech coder | |
CA2193577C (en) | Coding of a speech or music signal with quantization of harmonics components specifically and then residue components | |
WO2007124485A2 (en) | Method and apparatus for audio transcoding | |
Chan et al. | A fast method of designing better codebooks for image vector quantization | |
CN107077857B (zh) | 对线性预测系数量化的方法和装置及解量化的方法和装置 | |
EP1513137A1 (en) | Speech processing system and method with multi-pulse excitation | |
CA2090205C (en) | Speech coding system | |
KR100651712B1 (ko) | 광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기및 그 방법 | |
WO2009015944A1 (en) | A low-delay audio coder | |
Özaydın et al. | Matrix quantization and mixed excitation based linear predictive speech coding at very low bit rates | |
US20080183465A1 (en) | Methods and Apparatus to Quantize and Dequantize Linear Predictive Coding Coefficient | |
Kuo et al. | New LSP encoding method based on two-dimensional linear prediction | |
KR101052301B1 (ko) | 음성신호 양자화 장치 및 방법 | |
KR19980076955A (ko) | 음성 선스펙트럼 주파수의 부호화/복호화 장치 및 그 방법 | |
Chatterjee et al. | Low complexity wideband LSF quantization using GMM of uncorrelated Gaussian mixtures | |
Chatterjee et al. | Reduced complexity two stage vector quantization | |
JPH09120300A (ja) | ベクトル量子化装置 | |
Nordén et al. | Recursive LPC spectrum coding-a classified VQ approach | |
JP2683734B2 (ja) | 音声符号化法 | |
Miseki et al. | Adaptive bit-allocation between the pole-zero synthesis filter and excitation in CELP | |
Lois | Variable Length Coding of Transformed LSF Coefficients |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20120716 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20130724 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20140721 Year of fee payment: 11 |
|
FPAY | Annual fee payment |
Payment date: 20150902 Year of fee payment: 12 |
|
FPAY | Annual fee payment |
Payment date: 20160718 Year of fee payment: 13 |
|
FPAY | Annual fee payment |
Payment date: 20170719 Year of fee payment: 14 |
|
FPAY | Annual fee payment |
Payment date: 20180718 Year of fee payment: 15 |