KR100752797B1 - 음성 코더에서 선 스펙트럼 정보 양자화법을 인터리빙하는 방법 및 장치 - Google Patents
음성 코더에서 선 스펙트럼 정보 양자화법을 인터리빙하는 방법 및 장치 Download PDFInfo
- Publication number
- KR100752797B1 KR100752797B1 KR1020027000784A KR20027000784A KR100752797B1 KR 100752797 B1 KR100752797 B1 KR 100752797B1 KR 1020027000784 A KR1020027000784 A KR 1020027000784A KR 20027000784 A KR20027000784 A KR 20027000784A KR 100752797 B1 KR100752797 B1 KR 100752797B1
- Authority
- KR
- South Korea
- Prior art keywords
- vector
- frame
- quantized
- moving average
- quantization
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0004—Design or structure of the codebook
- G10L2019/0005—Multi-stage vector quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/12—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
Abstract
Description
음성을 압축하기 위한 장치는 여러 통신 분야에서 사용된다. 그 한 예가 무선 통신이다. 무선 통신 분야는 무선 전화, 무선 호출, 무선 가입자 회선, 핸드폰이나 개인휴대통신(PCS) 시스템과 같은 무선 통화, 이동 인터넷 프로토콜(IP) 통화, 그리고 위성 통신 시스템과 같은 많은 응용들이 있다. 특히 중요한 응용은 이동 전화 가입자를 위한 무선 통화이다.
본 발명은 주기적 및 비주기적 프레임 사이의 변화에 적응하는 다중 벡터 양자화 방법을 사용하는 음성 코더에 관한 것이다. 따라서, 본 발명의 일 특징에 따르면, 음성 코더는 바람직하게는 프레임을 분석하여 상기 분석에 기초한 선 스펙트럼 정보 코드벡터를 생성하도록 구성된 선형 예측 필터; 및 상기 선형 예측 필터에 연결되며 비이동-평균-예측-기반 양자화 방식을 사용하는 제 1 벡터 양자화 기술로 상기 선형 스펙트럼 정보 벡터를 벡터 양자화하도록 구성된 양자화기를 포함하며, 상기 양자화기는 제 1 기술에 대한 등가 이동 평균 코드벡터를 계산하며, 등가 이동 평균 코드벡터로 상기 음성 코더에 의해 미리 처리된 사전결정된 수의 프레임에 대해 코드벡터의 이동 평균 코드북의 메모리를 갱신하며, 상기 갱신된 이동 평균 코드북 메모리에 기초하여 제 2 기술에 대한 목표 양자화 벡터를 계산하며, 양자화된 목표 코드벡터를 생성하기 위해 제 2 벡터 양자화 기술로 상기 목표 양자화 벡터를 벡터 양자화하며 -상기 제 2 벡터 양자화 기술은 이동-평균-예측-기반 방식을 사용하며-, 상기 이동 평균 코드북의 메모리를 상기 양자화된 목표 코드벡터로 갱신하며, 및 상기 양자화된 목표 코드벡터로부터 양자화된 선 스펙트럼 정보 벡터를 계산하도록 구성된다.
각 프레임의 음성 콘텐츠의 성질에 따라 반응하는 적응성 코딩 방법을 제공하는 것이 바람직하다. 게다가 음성 신호는 보통 비정상 상태 또는 비고정 상태이므로, 음성 코딩에서 이용되는 선 스펙트럼 정보(LSI) 파라미터의 양자화의 효율은 음성의 각 프레임의 LSI파라미터가 이동-평균(MA)-예측-기반 벡터 양자화(VQ)또는 다른 표준 VQ 방법을 이용하여 선택적으로 코딩되는 방식을 사용하여 향상시킬 수 있다. 그러한 방식은 상기 VQ의 두 가지 방법중 하나의 장점을 적절히 이용할 수 있다. 따라서 한 방법에서 다른 방법으로 바뀌는 경계에서 두 방식을 적당히 조합하여 VQ의 두 방법을 인터리빙하는 음성 코더를 제공함이 바람직하다. 따라서 주기적 프레임과 비주기적 프레임간의 변화에 적응하기 위해 다중 벡터 양자화 방법을 이용하는 음성 코더가 필요하다.
Claims (20)
- 음성 코더로서,프레임을 분석하여 상기 분석에 기초한 선 스펙트럼 정보 코드벡터를 생성하도록 구성된 선형 예측 필터; 및상기 선형 예측 필터에 연결되며 비이동-평균-예측-기반 벡터 양자화 방식을 사용하는 제 1 벡터 양자화 기술로 상기 선형 스펙트럼 정보 벡터를 벡터 양자화하도록 구성된 양자화기를 포함하며,상기 양자화기는:제 1 벡터 양자화 기술에 대한 등가 이동 평균 코드벡터를 계산하며,등가 이동 평균 코드벡터로 상기 음성 코더에 의해 미리 처리된 사전결정된 수의 프레임에 대해 코드벡터의 이동 평균 코드북의 메모리를 갱신하며,상기 갱신된 이동 평균 코드북 메모리에 기초하여 제 2 벡터 양자화 기술에 대한 목표 양자화 벡터를 계산하며,양자화된 목표 코드벡터를 생성하기 위해 제 2 벡터 양자화 기술로 상기 목표 양자화 벡터를 벡터 양자화하며 -상기 제 2 벡터 양자화 기술은 이동-평균-예측-기반 방식을 사용하며-,상기 이동 평균 코드북의 메모리를 상기 양자화된 목표 코드벡터로 갱신하며, 그리고상기 양자화된 목표 코드벡터로부터 양자화된 선 스펙트럼 정보 벡터를 계산하도록 구성되는 음성 코더.
- 제1항에 있어서, 상기 프레임은 음성 프레임인 음성 코더.
- 제1항에 있어서, 상기 프레임은 선형 예측 잔여 프레임인 음성 코더.
- 제1항에 있어서, 상기 음성 코더는 무선 통신 시스템의 가입자 유닛내에 존재하는 음성 코더.
- 제 1 및 제 2 벡터 양자화 기술을 이용하여 프레임의 선 스펙트럼 정보 벡터를 벡터 양자화하는 방법 - 상기 제 1 기술은 비이동-평균-예측-기반 벡터 양자화 방식을 사용하고 제 2 기술은 이동-평균-예측-기반 벡터 양자화 방식을 사용함 -으로서,상기 제 1 벡터 양자화 기술로 선 스펙트럼 정보 벡터를 벡터 양자화하는 단계;상기 제 1 기술에 대한 등가 이동 평균 코드벡터를 계산하는 단계;상기 등가 이동 평균 코드벡터로 음성 코더에 의해 미리 처리된 사전결정된 수의 프레임에 대한 코드 벡터의 이동 평균 코드북 메모리를 갱신하는 단계;상기 갱신된 이동 평균 코드북 메모리에 기초하여 상기 제 2 기술에 대해 목표 양자화 벡터를 계산하는 단계;양자화된 목표 코드벡터를 생성하기 위해 상기 제 2 벡터 양자화 기술로 상기 목표 양자화 벡터를 벡터 양자화하는 단계;상기 양자화된 목표 코드벡터로 상기 이동 평균 코드북의 메모리를 갱신하는 단계; 및상기 양자화된 목표 코드벡터로부터 양자화된 선 스펙트럼 정보 벡터를 유도하는 단계를 포함하는 방법.
- 제8항에 있어서, 상기 프레임은 음성 프레임인 방법.
- 제8항에 있어서, 상기 프레임은 선형 예측 잔여 프레임인 방법.
- 음성 코더로서,비이동-평균-예측-기반 벡터 양자화 방식을 사용하는 제 1 벡터 양자화 기술로 프레임의 선 스펙트럼 정보 벡터를 벡터 양자화하는 수단;상기 제 1 벡터 양자화 기술에 대한 등가 이동 평균 코드벡터를 계산하는 수단;상기 등가 이동 평균 코드 벡터로 음성 코더에 의해 미리 처리된 사전결정된 수의 프레임에 대한 코드벡터의 이동 평균 코드북의 메모리를 갱신하는 수단;상기 갱신된 이동 평균 코드북 메모리에 기초하여 이동-평균-예측-기반 벡터 양자화 방식을 사용하는 제 2 벡터 양자화 기술에 대한 목표 양자화 벡터를 계산하는 수단;양자화된 목표 코드벡터를 생성하기 위해 상기 제 2 벡터 양자화 기술로 상기 목표 양자화 벡터를 양자화하는 수단;상기 양자화된 목표 코드벡터로 상기 이동 평균 코드북의 메모리를 갱신하는 수단; 및상기 양자화된 목표 코드벡터로부터 양자화된 선 스펙트럼 정보 벡터를 유도하는 수단을 포함하는 음성 코더.
- 제14항에 있어서, 상기 프레임은 음성 프레임인 음성 코더.
- 제14항에 있어서, 상기 프레임은 선형 예측 잔여 프레임인 음성 코더.
- 제14항에 있어서, 상기 음성 코더는 무선 통신 시스템의 가입자 유닛에 존재하는 음성 코더.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/356,755 | 1999-07-19 | ||
US09/356,755 US6393394B1 (en) | 1999-07-19 | 1999-07-19 | Method and apparatus for interleaving line spectral information quantization methods in a speech coder |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20020033737A KR20020033737A (ko) | 2002-05-07 |
KR100752797B1 true KR100752797B1 (ko) | 2007-08-29 |
Family
ID=23402819
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020027000784A KR100752797B1 (ko) | 1999-07-19 | 2000-07-19 | 음성 코더에서 선 스펙트럼 정보 양자화법을 인터리빙하는 방법 및 장치 |
Country Status (12)
Country | Link |
---|---|
US (1) | US6393394B1 (ko) |
EP (1) | EP1212749B1 (ko) |
JP (1) | JP4511094B2 (ko) |
KR (1) | KR100752797B1 (ko) |
CN (1) | CN1145930C (ko) |
AT (1) | ATE322068T1 (ko) |
AU (1) | AU6354600A (ko) |
BR (1) | BRPI0012540B1 (ko) |
DE (1) | DE60027012T2 (ko) |
ES (1) | ES2264420T3 (ko) |
HK (1) | HK1045396B (ko) |
WO (1) | WO2001006495A1 (ko) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6735253B1 (en) | 1997-05-16 | 2004-05-11 | The Trustees Of Columbia University In The City Of New York | Methods and architecture for indexing and editing compressed video over the world wide web |
US7143434B1 (en) | 1998-11-06 | 2006-11-28 | Seungyup Paek | Video description system and method |
DE60137376D1 (de) * | 2000-04-24 | 2009-02-26 | Qualcomm Inc | Verfahren und Vorrichtung zur prädiktiven Quantisierung von stimmhaften Sprachsignalen |
US6937979B2 (en) * | 2000-09-15 | 2005-08-30 | Mindspeed Technologies, Inc. | Coding based on spectral content of a speech signal |
US20040128511A1 (en) * | 2000-12-20 | 2004-07-01 | Qibin Sun | Methods and systems for generating multimedia signature |
US20040204935A1 (en) * | 2001-02-21 | 2004-10-14 | Krishnasamy Anandakumar | Adaptive voice playout in VOP |
WO2002097796A1 (en) * | 2001-05-28 | 2002-12-05 | Intel Corporation | Providing shorter uniform frame lengths in dynamic time warping for voice conversion |
AU2002351310A1 (en) * | 2001-12-06 | 2003-06-23 | The Trustees Of Columbia University In The City Of New York | System and method for extracting text captions from video and generating video summaries |
US7289459B2 (en) * | 2002-08-07 | 2007-10-30 | Motorola Inc. | Radio communication system with adaptive interleaver |
WO2006096612A2 (en) | 2005-03-04 | 2006-09-14 | The Trustees Of Columbia University In The City Of New York | System and method for motion estimation and mode decision for low-complexity h.264 decoder |
UA91853C2 (ru) * | 2005-04-01 | 2010-09-10 | Квелкомм Инкорпорейтед | Способ и устройство для векторного квантования спектрального представления огибающей |
JP4981122B2 (ja) * | 2006-03-21 | 2012-07-18 | フランス・テレコム | 抑制されたベクトル量子化 |
US7463170B2 (en) * | 2006-11-30 | 2008-12-09 | Broadcom Corporation | Method and system for processing multi-rate audio from a plurality of audio processing sources |
US7465241B2 (en) * | 2007-03-23 | 2008-12-16 | Acushnet Company | Functionalized, crosslinked, rubber nanoparticles for use in golf ball castable thermoset layers |
WO2009126785A2 (en) | 2008-04-10 | 2009-10-15 | The Trustees Of Columbia University In The City Of New York | Systems and methods for image archaeology |
WO2009155281A1 (en) * | 2008-06-17 | 2009-12-23 | The Trustees Of Columbia University In The City Of New York | System and method for dynamically and interactively searching media data |
US20100017196A1 (en) * | 2008-07-18 | 2010-01-21 | Qualcomm Incorporated | Method, system, and apparatus for compression or decompression of digital signals |
US8671069B2 (en) | 2008-12-22 | 2014-03-11 | The Trustees Of Columbia University, In The City Of New York | Rapid image annotation via brain state decoding and visual pattern mining |
CN102982807B (zh) * | 2012-07-17 | 2016-02-03 | 深圳广晟信源技术有限公司 | 用于对语音信号lpc系数进行多级矢量量化的方法和系统 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4901307A (en) | 1986-10-17 | 1990-02-13 | Qualcomm, Inc. | Spread spectrum multiple access communication system using satellite or terrestrial repeaters |
US5103459B1 (en) | 1990-06-25 | 1999-07-06 | Qualcomm Inc | System and method for generating signal waveforms in a cdma cellular telephone system |
WO1992022891A1 (en) | 1991-06-11 | 1992-12-23 | Qualcomm Incorporated | Variable rate vocoder |
US5784532A (en) | 1994-02-16 | 1998-07-21 | Qualcomm Incorporated | Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system |
TW271524B (ko) | 1994-08-05 | 1996-03-01 | Qualcomm Inc | |
US5664055A (en) * | 1995-06-07 | 1997-09-02 | Lucent Technologies Inc. | CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity |
US5699485A (en) * | 1995-06-07 | 1997-12-16 | Lucent Technologies Inc. | Pitch delay modification during frame erasures |
US5732389A (en) * | 1995-06-07 | 1998-03-24 | Lucent Technologies Inc. | Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures |
JP3680380B2 (ja) * | 1995-10-26 | 2005-08-10 | ソニー株式会社 | 音声符号化方法及び装置 |
DE19845888A1 (de) * | 1998-10-06 | 2000-05-11 | Bosch Gmbh Robert | Verfahren zur Codierung oder Decodierung von Sprachsignalabtastwerten sowie Coder bzw. Decoder |
-
1999
- 1999-07-19 US US09/356,755 patent/US6393394B1/en not_active Expired - Lifetime
-
2000
- 2000-07-19 ES ES00950441T patent/ES2264420T3/es not_active Expired - Lifetime
- 2000-07-19 DE DE60027012T patent/DE60027012T2/de not_active Expired - Lifetime
- 2000-07-19 EP EP00950441A patent/EP1212749B1/en not_active Expired - Lifetime
- 2000-07-19 BR BRPI0012540A patent/BRPI0012540B1/pt active IP Right Grant
- 2000-07-19 WO PCT/US2000/019672 patent/WO2001006495A1/en active IP Right Grant
- 2000-07-19 AU AU63546/00A patent/AU6354600A/en not_active Abandoned
- 2000-07-19 AT AT00950441T patent/ATE322068T1/de not_active IP Right Cessation
- 2000-07-19 KR KR1020027000784A patent/KR100752797B1/ko active IP Right Grant
- 2000-07-19 JP JP2001511670A patent/JP4511094B2/ja not_active Expired - Lifetime
- 2000-07-19 CN CNB008103526A patent/CN1145930C/zh not_active Expired - Lifetime
-
2002
- 2002-09-20 HK HK02106869.3A patent/HK1045396B/zh not_active IP Right Cessation
Non-Patent Citations (2)
Title |
---|
LOO J H Y et al. 'Classified nonlinear predictive vector quantization of speech spectral parameters' In:ICASSP'96. IEEE,1996,Vol.2,pages 761-764. |
SKOGLUND J et al. 'Predictive VQ for Noisy Channel Spectrum Coding: AR or MA?' In:ICASSP'97. IEEE,21.04.1997,pages 1351-1354. |
Also Published As
Publication number | Publication date |
---|---|
EP1212749B1 (en) | 2006-03-29 |
BRPI0012540B1 (pt) | 2015-12-01 |
CN1145930C (zh) | 2004-04-14 |
HK1045396B (zh) | 2005-02-18 |
DE60027012D1 (de) | 2006-05-18 |
KR20020033737A (ko) | 2002-05-07 |
JP4511094B2 (ja) | 2010-07-28 |
CN1361913A (zh) | 2002-07-31 |
HK1045396A1 (en) | 2002-11-22 |
JP2003524796A (ja) | 2003-08-19 |
ES2264420T3 (es) | 2007-01-01 |
ATE322068T1 (de) | 2006-04-15 |
BR0012540A (pt) | 2004-06-29 |
EP1212749A1 (en) | 2002-06-12 |
DE60027012T2 (de) | 2007-01-11 |
AU6354600A (en) | 2001-02-05 |
WO2001006495A1 (en) | 2001-01-25 |
US6393394B1 (en) | 2002-05-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100804461B1 (ko) | 보이스화된 음성을 예측적으로 양자화하는 방법 및 장치 | |
KR100805983B1 (ko) | 가변율 음성 코더에서 프레임 소거를 보상하는 방법 | |
KR100898323B1 (ko) | 음성 코더용 스펙트럼 크기 양자화 방법 | |
KR100752797B1 (ko) | 음성 코더에서 선 스펙트럼 정보 양자화법을 인터리빙하는 방법 및 장치 | |
JP4782332B2 (ja) | 音声符号器における目標ビットレートを維持する方法および装置 | |
US6324503B1 (en) | Method and apparatus for providing feedback from decoder to encoder to improve performance in a predictive speech coder under frame erasure conditions | |
KR100804888B1 (ko) | 프레임 에러에 대한 민감도를 감소시키기 위하여 코딩 방식선택 패턴을 사용하는 예측 음성 코더 | |
US7085712B2 (en) | Method and apparatus for subsampling phase spectrum information | |
KR100756570B1 (ko) | 음성 코더의 프레임 프로토타입들 사이의 선형 위상시프트들을 계산하기 위해 주파수 대역들을 식별하는 방법및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20120727 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20130729 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20140730 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20160629 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20170629 Year of fee payment: 11 |
|
FPAY | Annual fee payment |
Payment date: 20180628 Year of fee payment: 12 |