KR970019119A - 선형예측부호화계수의 부호화 및 복호화방법 - Google Patents
선형예측부호화계수의 부호화 및 복호화방법 Download PDFInfo
- Publication number
- KR970019119A KR970019119A KR1019950031676A KR19950031676A KR970019119A KR 970019119 A KR970019119 A KR 970019119A KR 1019950031676 A KR1019950031676 A KR 1019950031676A KR 19950031676 A KR19950031676 A KR 19950031676A KR 970019119 A KR970019119 A KR 970019119A
- Authority
- KR
- South Korea
- Prior art keywords
- vector
- codebook
- lsf
- median
- learning
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 18
- 239000013598 vector Substances 0.000 claims abstract 46
- 238000013139 quantization Methods 0.000 claims abstract 13
- 238000001228 spectrum Methods 0.000 claims abstract 4
- 238000000926 separation method Methods 0.000 claims 2
- 230000001186 cumulative effect Effects 0.000 claims 1
- 230000006870 function Effects 0.000 claims 1
- 238000005070 sampling Methods 0.000 claims 1
- 230000003595 spectral effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
본 발명은 음성신호의 부호화 및 복호화에 관한 것으로, 선형예측부호화(LPC)계수를 n차 선스펙트럼주파수(LSFs)로 변환하고 상기 LSFs 계수를 양자화하는 방법에 있어서, 상기 n차 LSFs벡터를 하위, 중위, 상이 3개의 부벡터로 나누는 단계; 중위부 벡터를 중위코드북을 사용하여 양자화하는 단계; 중위부벡터의 최하위 LSF값과 하위부벡터의 LSF값에 따라 복수의 하위코드북 중에 하나의 하위코드북을 결정하고, 결정된 하위코드북을 사용하여 하위부벡터를 양자화하는 단계; 중위부벡터의 최상위 LSF값과 상위부벡터의 LSF값에 따라 복수의 상위코드북 중에 하나의 상위코드북을 결정하고, 결정된 상위코드북을 사용하여 상위북코드를 양자화하는 단계를 포함한다.
본 발명에 의하면 LSVQ를 사용하여 LSFs를 양자화함으로써, 효율적인 코드북 탐색을 통하여 종래의 24비트/프레임 분리벡터 양자화(SVQ)에 비하여 23비트/프레임에서도 평균 스펙트럼 왜곡(SD)도 적도 아웃라이어(outlier)에서도 우수한 성능을 나타낸다.
Description
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 본 발명에 의한 제1분류기(first classifier)를 도시한 도면.
제2도는 본 발명에 의한 제2분류기(second classifier)를 도시한 도면.
제4도는 본 발명에 의한 부호화방법을 설명하기 위한 도면
제5도는 본 발명에 의한 복호화방법을 설명하기 위한 도면.
Claims (10)
- 음성부호화에서, 선형예측부호화(LPC)계수를 n차의 선스펙트럼주파수(LSFs)계수로 변환하고, 상기 LSFs계수를 벡터양자화하기 위해 요구되는 코드북을 학습하는 방법에 있어서, 상기 n차 LSFs벡터를 하위, 중위, 및 상위 3개의 부벡터로 분리하는 벡터분리단계; 중위부벡터를 중위코드북(COM)으로 학습하는 COM 학습단계; 중위부벡터의 최하위 LSF값과 하위부벡터의 LSF값의 연관성에 의존하여 하위부벡터를 복수의 하위코드북(COL)으로 학습하는 COL학습단계; 및 중위부벡터의 최상위 LSF값과 상위부벡터의 LSF값의 연관성에 의존하여 상위 부벡터를 복수의 상위코드북(COU)으로 학습하는 COU학습단계를 포함함을 특징으로 하는 선형예측부호화계수의 벡터양자화를 위한 코드북 학습방방법.
- 제1항에 있어서, 프레임당 코드북에 대한 비트할당은 하위코드북, 중위코드북, 및 상위코드북 중에 중위코드북에 제일 많은 비트를 할당함을 특징으로 하는 선형예측부호화계수의 벡터양자화를 위한 코드북 학습방법.
- 제1항에 있어서, 상기 COM 학습단계는 LBG 알고리즘을 이용함을 특징으로 하는 선형예측부호화계수의 벡터양자화를 위한 코드북 학습방법.
- 제1항에 있어서, 상기 COL학습단계는 중위부벡터의 최하위 LSF값의 범위를 복수개의 클래스로 분류하는 제1단계; 및 상기 분류된 각 클래스에 해당하는 중위부벡터의 최하위 LSF값과 하위부벡터의 LSF값과의 결합분포에 따라, 하위부벡터를 클래스 개수만큼의 하위코드북(COL)으로 학습하는 제2단계를 포함함을 특징으로 하는 선형예측부호화계수의 백터양자화를 위한 코드북 학습방법.
- 제4항에 있어서, 상기 제1단계는 분류된 각 클래스에서 중위부벡터의 최하위 LSF값의 범위에 대한 누적분포확률이 서로 같도록 클래스를 분류함을 특징으로 하는 선형예측부호화계수의 백터양자화를 위한 코드북 학습방법.
- 제1항에 있어서, 상기 COU학습단계는 중위부벡터의 최상위 LSF값의 범위를 복수개의 클래스로 분류하는 제1단계; 및 상기 분류된 각 클래스에 해당하는중위부벡터의 최상위 LSF값과 상위부벡터의 LSF값과의 결합분포에 따라, 상위부벡터를 클래스 개수만큼의 상위코드북(COU)으로 학습하는 제2단계를 포함함을 특징으로 하는 선형예측부호화계수의 백터양자화를 위한 코드북 학습방법.
- 제6항에 있어서, 상기 제1단계는 분류된 각 클래스에서 중위부벡터의 최상위 LSF값의 범위에 대한 누적분 포확률이 서로 같도록 클래스를 분류함을 특징으로 하는 선형예측부호화계수의 백터양자화를 위한 코드북 학습방법.
- 음성부호화에서, 선형예측부호화(LPC)계수를 n차의 선스펙트럼주파수(LSFs)계수로 변환하고, 상기 LSFs계수를 양자화하는 방법에 있어서, 상기 n차 LSFs벡터를 하위, 중위, 및 상위 3개의 부벡터로 나누는 벡터분리 단계; 중위부벡터를 중위코드북(COM)을 사용하여 양자화하여 제1인덱스를 생성하는 중위부벡터양자화 단계; 중위부벡터의 최하위 LSF값과 하위부벡터의 LSF값에 따라 복수의 하위코드북 중에 하나의 하위코드북을 결정하고, 결정된 하위코드북을 사용하여 하위부벡터를 양자화하여 제2인덱스를 생성하는 하위부벡터양자화단계; 중위부벡터의 최상위 LSF값과 상위부벡터의 LSF값에 따라 복수의 상위코드북 중에 하나의 상위코드북을 결정하고, 결정된 상위코드북을 사용하여 상위부벡터를 양자화하여 제3인덱스를 생성하는 상위부벡터양자화단계; 및 상기 제1, 제2 및 제3인덱스를 전송하는 단계를 포함함을 특징으로 하는 선형예측부호화계수의 부호화방법.
- 제8항에 있어서, 상기 제1, 제2 및 제3인덱스를 생성하는 양자화단계에서 가장 근접한 코드벡터를 구하기 위해서 다음의 식과 같은 가중 유클리드 거리치 d(ω,ω)를 사용함을 특징으로 하는 선형예측부호화계수의 부호화방법.여기서, v(ⅰ)는 ⅰ번째 LSF의 가변가중치함수, ω는 양자화되기 전의 LSFs, ω는 양자화 후에 코드북 내에 보관된 코드벡터의 값, 그리고 ωⅰ와 ωⅰ는 ω의 ⅰ번째 LSF이며,여기서, ω0=0, ωp-1=fs/2(fs는 샘플링 주파수이다.)
- 부호화기에서 n차 LSFs벡터를 하위,중위, 및 상위부벡터로 나누어 각각 양자화하여 생성된 제1, 제2 및 제3인덱스를 이용하여 선스펙트럼주파수(LSFs)계수로 복원시키기 위한 복호화방법에 있어서, 중위코드북을 사용하여 제1인덱스에 해당하는 코드벡터를 선택하여 양자화된 중위부벡터를 생성하는 중위부벡터생성단계; 상기 중위부벡터생성단계에서 생성된 중위부벡터의 최하위 LSF값에 따라 복수의 하위코드북 중에 하나의 하위코드북을 결정하고, 결정된 하위코드북을 사용하여 제2인덱스에 해당하는 코드벡터를 선택하여 양자화된 하위부벡터를 생성하는 하위부벡터 생성단계; 및 상기 중위부벡터생성단계에서 생성된 중위부벡터의 최상위 LSF값에 따라 복수의 상위코드북 중에 하나의 상위코드북을 결정하고, 결정된 상위코드북을 사용하여 제3인덱스에 해당하는 코드벡터를 선택하여 양자화된 상위부벡터를 생성하는 상위부벡터생성단계를 포함함을 특징으로 하는 선형예측양자화계수의 복호화방법.※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019950031676A KR100322706B1 (ko) | 1995-09-25 | 1995-09-25 | 선형예측부호화계수의부호화및복호화방법 |
US08/710,943 US5822723A (en) | 1995-09-25 | 1996-09-24 | Encoding and decoding method for linear predictive coding (LPC) coefficient |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019950031676A KR100322706B1 (ko) | 1995-09-25 | 1995-09-25 | 선형예측부호화계수의부호화및복호화방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR970019119A true KR970019119A (ko) | 1997-04-30 |
KR100322706B1 KR100322706B1 (ko) | 2002-06-20 |
Family
ID=19427767
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019950031676A KR100322706B1 (ko) | 1995-09-25 | 1995-09-25 | 선형예측부호화계수의부호화및복호화방법 |
Country Status (2)
Country | Link |
---|---|
US (1) | US5822723A (ko) |
KR (1) | KR100322706B1 (ko) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100712056B1 (ko) * | 2002-12-24 | 2007-05-02 | 노키아 코포레이션 | 가변 비트율 음성 부호화에서의 선형 예측 매개변수들의견실한 예측 벡터 양자화를 위한 방법 및 장치 |
CN111933159A (zh) * | 2017-11-10 | 2020-11-13 | 弗劳恩霍夫应用研究促进协会 | 调适最低有效比特的编码与解码的音频编码器、音频解码器、方法及计算机程序 |
US12033646B2 (en) | 2017-11-10 | 2024-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6889185B1 (en) * | 1997-08-28 | 2005-05-03 | Texas Instruments Incorporated | Quantization of linear prediction coefficients using perceptual weighting |
JP3357829B2 (ja) * | 1997-12-24 | 2002-12-16 | 株式会社東芝 | 音声符号化/復号化方法 |
KR20010040902A (ko) * | 1998-02-12 | 2001-05-15 | 비센트 비.인그라시아, 알크 엠 아헨 | 분리 벡터 양자화 데이터 부호화를 제공하기 위한 시스템및 방법 |
US6148283A (en) * | 1998-09-23 | 2000-11-14 | Qualcomm Inc. | Method and apparatus using multi-path multi-stage vector quantizer |
US6285994B1 (en) | 1999-05-25 | 2001-09-04 | International Business Machines Corporation | Method and system for efficiently searching an encoded vector index |
US6959274B1 (en) * | 1999-09-22 | 2005-10-25 | Mindspeed Technologies, Inc. | Fixed rate speech compression system and method |
KR100324204B1 (ko) | 1999-12-24 | 2002-02-16 | 오길록 | 예측분할벡터양자화 및 예측분할행렬양자화 방식에 의한선스펙트럼쌍 양자화기의 고속탐색방법 |
KR20020075592A (ko) * | 2001-03-26 | 2002-10-05 | 한국전자통신연구원 | 광대역 음성 부호화기용 lsf 양자화기 |
US7003454B2 (en) * | 2001-05-16 | 2006-02-21 | Nokia Corporation | Method and system for line spectral frequency vector quantization in speech codec |
CN1989546B (zh) * | 2004-07-20 | 2011-07-13 | 松下电器产业株式会社 | 语音编码装置和语音编码方法 |
US7630902B2 (en) * | 2004-09-17 | 2009-12-08 | Digital Rise Technology Co., Ltd. | Apparatus and methods for digital audio coding using codebook application ranges |
KR100647290B1 (ko) | 2004-09-22 | 2006-11-23 | 삼성전자주식회사 | 합성된 음성의 특성을 이용하여 양자화/역양자화를선택하는 음성 부호화/복호화 장치 및 그 방법 |
KR101393301B1 (ko) * | 2005-11-15 | 2014-05-28 | 삼성전자주식회사 | 선형예측계수의 양자화 및 역양자화 방법 및 장치 |
KR100791545B1 (ko) * | 2006-12-29 | 2008-01-04 | (주)엘비티솔루션 | 동영상 압축방법 |
KR101512320B1 (ko) | 2008-01-02 | 2015-04-23 | 삼성전자주식회사 | 양자화 및 역양자화 방법 및 장치 |
CA2877161C (en) * | 2012-06-28 | 2020-01-21 | Tom Backstrom | Linear prediction based audio coding using improved probability distribution estimation |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5384891A (en) * | 1988-09-28 | 1995-01-24 | Hitachi, Ltd. | Vector quantizing apparatus and speech analysis-synthesis system using the apparatus |
US5012518A (en) * | 1989-07-26 | 1991-04-30 | Itt Corporation | Low-bit-rate speech coder using LPC data reduction processing |
JPH0365822A (ja) * | 1989-08-04 | 1991-03-20 | Fujitsu Ltd | ベクトル量子化符号器及びベクトル量子化復号器 |
JP3151874B2 (ja) * | 1991-02-26 | 2001-04-03 | 日本電気株式会社 | 音声パラメータ符号化方式および装置 |
JP3224955B2 (ja) * | 1994-05-27 | 2001-11-05 | 株式会社東芝 | ベクトル量子化装置およびベクトル量子化方法 |
JPH08272395A (ja) * | 1995-03-31 | 1996-10-18 | Nec Corp | 音声符号化装置 |
-
1995
- 1995-09-25 KR KR1019950031676A patent/KR100322706B1/ko not_active IP Right Cessation
-
1996
- 1996-09-24 US US08/710,943 patent/US5822723A/en not_active Expired - Lifetime
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100712056B1 (ko) * | 2002-12-24 | 2007-05-02 | 노키아 코포레이션 | 가변 비트율 음성 부호화에서의 선형 예측 매개변수들의견실한 예측 벡터 양자화를 위한 방법 및 장치 |
CN111933159A (zh) * | 2017-11-10 | 2020-11-13 | 弗劳恩霍夫应用研究促进协会 | 调适最低有效比特的编码与解码的音频编码器、音频解码器、方法及计算机程序 |
CN111933159B (zh) * | 2017-11-10 | 2024-04-09 | 弗劳恩霍夫应用研究促进协会 | 调适最低有效比特的编码与解码的音频编码器、音频解码器、方法及计算机程序 |
US12033646B2 (en) | 2017-11-10 | 2024-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
Also Published As
Publication number | Publication date |
---|---|
KR100322706B1 (ko) | 2002-06-20 |
US5822723A (en) | 1998-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR970019119A (ko) | 선형예측부호화계수의 부호화 및 복호화방법 | |
US5774839A (en) | Delayed decision switched prediction multi-stage LSF vector quantization | |
US8352253B2 (en) | Speech coder and speech decoder | |
JP4005154B2 (ja) | 音声復号化方法及び装置 | |
US6023672A (en) | Speech coder | |
US6014622A (en) | Low bit rate speech coder using adaptive open-loop subframe pitch lag estimation and vector quantization | |
US6134520A (en) | Split vector quantization using unequal subvectors | |
EP1093115A2 (en) | Predictive coding of pitch lag in a speech coder | |
US5890110A (en) | Variable dimension vector quantization | |
JP5300733B2 (ja) | ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法 | |
EP1162604B1 (en) | High quality speech coder at low bit rates | |
US8493244B2 (en) | Vector quantization device, vector inverse-quantization device, and methods of same | |
EP0545386B1 (en) | Method for speech coding and voice-coder | |
EP0401452B1 (en) | Low-delay low-bit-rate speech coder | |
US6199040B1 (en) | System and method for communicating a perceptually encoded speech spectrum signal | |
KR101393301B1 (ko) | 선형예측계수의 양자화 및 역양자화 방법 및 장치 | |
Kim et al. | Linked split-vector quantizer of LPC parameters | |
So et al. | Efficient vector quantisation of line spectral frequencies using the switched split vector quantiser. | |
KR100446594B1 (ko) | 음성선스펙트럼주파수의부호화/복호화장치및그방법 | |
JPH0764599A (ja) | 線スペクトル対パラメータのベクトル量子化方法とクラスタリング方法および音声符号化方法並びにそれらの装置 | |
Djamah et al. | An efficient tree-structured codebook design for embedded vector quantization | |
KR100300963B1 (ko) | 연결스칼라양자화기 | |
KR100389897B1 (ko) | 분할된 lsf 벡터의 예측-연결 양자화 방법 | |
Merouane et al. | Efficient coding of wideband ISF parameters: Application of variable rate SSVQ scheme | |
JP3144194B2 (ja) | 音声符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20081224 Year of fee payment: 8 |
|
LAPS | Lapse due to unpaid annual fee |