KR970076487A - 음성 부호화 장치 및 음성 부호화 복호화 장치 - Google Patents
음성 부호화 장치 및 음성 부호화 복호화 장치 Download PDFInfo
- Publication number
- KR970076487A KR970076487A KR1019970001026A KR19970001026A KR970076487A KR 970076487 A KR970076487 A KR 970076487A KR 1019970001026 A KR1019970001026 A KR 1019970001026A KR 19970001026 A KR19970001026 A KR 19970001026A KR 970076487 A KR970076487 A KR 970076487A
- Authority
- KR
- South Korea
- Prior art keywords
- sound source
- vector
- speech
- generating
- frame
- Prior art date
Links
- 230000003044 adaptive effect Effects 0.000 claims abstract 20
- 230000003595 spectral effect Effects 0.000 claims 2
- 238000001228 spectrum Methods 0.000 claims 2
- 230000006978 adaptation Effects 0.000 claims 1
- 230000005284 excitation Effects 0.000 claims 1
- 230000006866 deterioration Effects 0.000 abstract 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0011—Long term prediction filters, i.e. pitch estimation
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
음성 부호화시 합성 음성의 품질의 열화를 회피하고, 적은 연산량으로 품질이 우수한 합성 음성을 생성할 수 있는 음성 부호화 장치를 성취한다.
음성 부호화 장치는, 입력 음성으로부터 지연 파라미타에 대응한 벡터 길이의 목표 음성 벡터를 생성하는 목표 음성 생성 수단과, 과거에 생성한 음원 신호로부터 상기 지연 파라미타에 대응한 벡터 길이의 적응 음원 벡터를 생성하는 적응 음원 부호 장부와, 상기 적응 음원 벡터로부터 취득된 합성 음성 벡터의 상기 목표 음성 벡터의 대한 왜곡을 평가하여, 왜곡이 최소가 되는 적응 음원 벡터를 탐색하는 적응 음원 탐색 수단과, 상기 왜곡이 최소가 되는 적응 음원 벡터로부터 프레임 길이의 음원 신호를 생성하는 프레임 음원 생성 수단을 구비한다.
Description
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 본 발명 실시형태 1인 음성 부호화 장치 및 음성 복호화 장치의 전체 구성을 도시하는 흐름도.
Claims (4)
- 입력 음성을 스텍트럼 포락 정보와 음원 신호 정보로 분리하여, 프레임 단위로 음원 신호 정보를 부호화하는 음성 부호화 장치에 있어서, 입력 음성으로부터 지연 파라미터에 대응한 벡터 길이의 목표 음성 벡터를 생성하는 목표 음성 생성 수단과, 과거에 생성한 음원 신호로부터 상기 지연 파라미타에 대응한 벡터 길이의 적응 음원 벡터를 생성하는 적응 음원 부호 장부와, 상기 적응 음원 벡터로부터 취득되는 합성 음성 벡터의 상기 목표 음성 벡터에 대한 왜곡을 평가하여, 왜곡이 최소가 되는 적응 음원 벡터를 탐색하는 적응 음원 탐색수단과, 상기 왜곡이 최소가 되는 적응 음원 벡터로부터 프레임 길이의 음원 신호를 생성하는 프레임 음원 생성 수단을 구비한 것을 특징으로 하는 음성 부호화 장치.
- 입력 음성을 스텍트럼 포락 정보와 음원 신호 정보로 분리하여, 프레임 단위로 음원 신호 정보를 부호화하는 음성 부호화 장치에 있어서, 입력 음성으로부터 지연 파라미타에 대응한 벡터 길이의 목표 음성 벡터를 생성하는 목표 음성 생성 수단과, 지연 파라미타에 대응한 벡터 길이의 구동 음원 벡터를 생성하는 구동 음원 부호 장부와, 상기 구동 음원 벡터로부터 취득되는 합성 음성 벡터의 상기 목표 음성 벡터에 대한 왜곡을 평가하여 왜곡이 최소가 되는 구동 음원 벡터를 탐색하는 구동 음원 탐색 수단과, 상기 왜곡이 최소가 되는 구동음원 벡터로부터 프레임 길이의 음원 신호를 생성하는 프레임 음원 생성 수단을 포함하는 것을 특징으로 하는 음성 부호화 장치.
- 입력 음성을 스펙트럼 포락 정보와 음원 신호 정보로 분리하여, 프레임 단위로 음원 신호 정보를 부호화하고, 부호화된 음원 신호 정보를 복호화하여 출력 음성을 생성하는 음성 부호화 복호화 장치에 있어서, 부호화측에 입력 음성으로부터 지연 파라미타에 대응한 벡터 길이의 목표 음성 벡터를 생성하는 목표 음성 생성 수단과, 과거에 생성한 음원 신호로부터 상기 지연 파라미타에 대응한 벡터 길이의 적응 음원 벡터를 생성하는 적응 음원 부호 장부와, 상기 적응 음원 벡터로부터 취득되는 합성 음성 벡터의 상기 목표 음성 벡터에 대한 왜곡을 평가하여, 왜곡이 최소가 되는 적응 음원 벡터를 탐색하는 적응 음원 탐색 수단과, 상기 왜곡이 최소가 되는 적응 음원 벡터로부터 프레임 길이의 음원 신호를 생성하는 프레임 음원 생성 수단을 구비하는 한편, 복호화측에서 지연 파라미타에 대응한 벡터 길이의 적응 음원 벡터를 생성하는 적응 음원 부호 장부와, 적응 음원 벡터로부터 프레임 길이의 음원 신호를 생성하는 프레임 음원 생성 수단을 포함하는 것을 특징으로 하는 음성 부호화 복호화 장치.
- 입력 음성을 스펙트럼 포락 정보와 음원 신호 정보로 분리하여, 프레임 단위로 음원 신호 정보를 부호화하여, 부호화된 음원 신호 정보를 복호하하여 출력 음성을 생성하는 음성 부호화 복호화 장치에 있어서, 부호화측에서 입력 음성으로부터 지연 파라미타에 대응한 벡터 길이의 목표 음성 벡터를 생성하는 목표 음성 생성수단과, 지연 파라미타에 대응한 벡터 길이의 구동 음원 벡터를 생성하는 구동 음원 부호 장부와, 상기 구동 음원 벡터로부터 취득되는 합성 음성 벡터의 상기 목표 음성 벡터에 대한 왜곡을 평가하여, 왜곡이 최소가 되는 구동 음원 벡터를 탐색하는 구동 음원 탐색 수단과, 상기 왜곡이 최소가 되는 구동 음원 벡터로부터 프레임 길이의 음원 신호를 생성하는 프레임 음원 생성 수단을 포함하는 한편, 복호화측에서는, 지연 파라미터에 대응한 벡터 길이의 구동 음원 벡터를 생성하는 구동음원 부호 장부와, 구동 음원 벡터로부터 프레임 길이의 음원 신호를 생성하는 프레임 음원 생성 수단을 포함하는 것을 특징으로 하는 음성 부호화 복호화 장치.※참고사항 : 최초출원 내용에 의하여 공개하는 것임.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP13524096A JP3364825B2 (ja) | 1996-05-29 | 1996-05-29 | 音声符号化装置および音声符号化復号化装置 |
JP96-135240 | 1996-05-29 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR970076487A true KR970076487A (ko) | 1997-12-12 |
KR100218214B1 KR100218214B1 (ko) | 1999-09-01 |
Family
ID=15147096
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019970001026A KR100218214B1 (ko) | 1996-05-29 | 1997-01-15 | 음성 부호화 장치 및 음성 부호화 복호화 장치 |
Country Status (8)
Country | Link |
---|---|
US (1) | US6052661A (ko) |
EP (1) | EP0810585B1 (ko) |
JP (1) | JP3364825B2 (ko) |
KR (1) | KR100218214B1 (ko) |
CN (1) | CN1151491C (ko) |
CA (1) | CA2194513C (ko) |
DE (1) | DE69720855D1 (ko) |
TW (1) | TW317631B (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100886062B1 (ko) * | 1997-10-22 | 2009-02-26 | 파나소닉 주식회사 | 확산 펄스 벡터 생성 장치 및 방법 |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19729494C2 (de) * | 1997-07-10 | 1999-11-04 | Grundig Ag | Verfahren und Anordnung zur Codierung und/oder Decodierung von Sprachsignalen, insbesondere für digitale Diktiergeräte |
CN1494055A (zh) * | 1997-12-24 | 2004-05-05 | ������������ʽ���� | 声音编码方法和声音译码方法以及声音编码装置和声音译码装置 |
JP3268750B2 (ja) * | 1998-01-30 | 2002-03-25 | 株式会社東芝 | 音声合成方法及びシステム |
US6249758B1 (en) * | 1998-06-30 | 2001-06-19 | Nortel Networks Limited | Apparatus and method for coding speech signals by making use of voice/unvoiced characteristics of the speech signals |
US7072832B1 (en) | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
US6507814B1 (en) | 1998-08-24 | 2003-01-14 | Conexant Systems, Inc. | Pitch determination using speech classification and prior pitch estimation |
US6330533B2 (en) | 1998-08-24 | 2001-12-11 | Conexant Systems, Inc. | Speech encoder adaptively applying pitch preprocessing with warping of target signal |
US6449590B1 (en) | 1998-08-24 | 2002-09-10 | Conexant Systems, Inc. | Speech encoder using warping in long term preprocessing |
FI111438B (fi) * | 1999-07-09 | 2003-07-15 | Nokia Corp | Symbolijonon lähetysmenetelmä |
JP4792613B2 (ja) * | 1999-09-29 | 2011-10-12 | ソニー株式会社 | 情報処理装置および方法、並びに記録媒体 |
JP3404024B2 (ja) | 2001-02-27 | 2003-05-06 | 三菱電機株式会社 | 音声符号化方法および音声符号化装置 |
JP4948401B2 (ja) * | 2005-05-31 | 2012-06-06 | パナソニック株式会社 | スケーラブル符号化装置およびスケーラブル符号化方法 |
US7966190B2 (en) * | 2005-07-11 | 2011-06-21 | Lg Electronics Inc. | Apparatus and method for processing an audio signal using linear prediction |
WO2009039897A1 (en) * | 2007-09-26 | 2009-04-02 | Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V. | Apparatus and method for extracting an ambient signal in an apparatus and method for obtaining weighting coefficients for extracting an ambient signal and computer program |
EP3301677B1 (en) | 2011-12-21 | 2019-08-28 | Huawei Technologies Co., Ltd. | Very short pitch detection and coding |
EP2862167B1 (en) * | 2012-06-14 | 2018-08-29 | Telefonaktiebolaget LM Ericsson (publ) | Method and arrangement for scalable low-complexity audio coding |
CN106448688B (zh) | 2014-07-28 | 2019-11-05 | 华为技术有限公司 | 音频编码方法及相关装置 |
EP2980794A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
EP2980795A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4910781A (en) | 1987-06-26 | 1990-03-20 | At&T Bell Laboratories | Code excited linear predictive vocoder using virtual searching |
US5235670A (en) * | 1990-10-03 | 1993-08-10 | Interdigital Patents Corporation | Multiple impulse excitation speech encoder and decoder |
US5195168A (en) * | 1991-03-15 | 1993-03-16 | Codex Corporation | Speech coder and method having spectral interpolation and fast codebook search |
JP3275247B2 (ja) * | 1991-05-22 | 2002-04-15 | 日本電信電話株式会社 | 音声符号化・復号化方法 |
US5396576A (en) * | 1991-05-22 | 1995-03-07 | Nippon Telegraph And Telephone Corporation | Speech coding and decoding methods using adaptive and random code books |
US5305421A (en) * | 1991-08-28 | 1994-04-19 | Itt Corporation | Low bit rate speech coding system and compression |
FI95085C (fi) * | 1992-05-11 | 1995-12-11 | Nokia Mobile Phones Ltd | Menetelmä puhesignaalin digitaaliseksi koodaamiseksi sekä puhekooderi menetelmän suorittamiseksi |
JPH07334194A (ja) * | 1994-06-14 | 1995-12-22 | Matsushita Electric Ind Co Ltd | 音声符号化/復号化方法およびそれらの装置 |
-
1996
- 1996-05-29 JP JP13524096A patent/JP3364825B2/ja not_active Expired - Lifetime
- 1996-12-16 TW TW085115514A patent/TW317631B/zh active
- 1996-12-31 US US08/777,874 patent/US6052661A/en not_active Expired - Fee Related
-
1997
- 1997-01-07 CA CA002194513A patent/CA2194513C/en not_active Expired - Fee Related
- 1997-01-15 KR KR1019970001026A patent/KR100218214B1/ko not_active IP Right Cessation
- 1997-01-30 DE DE69720855T patent/DE69720855D1/de not_active Expired - Lifetime
- 1997-01-30 EP EP97101441A patent/EP0810585B1/en not_active Expired - Lifetime
- 1997-03-12 CN CNB971029393A patent/CN1151491C/zh not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100886062B1 (ko) * | 1997-10-22 | 2009-02-26 | 파나소닉 주식회사 | 확산 펄스 벡터 생성 장치 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
US6052661A (en) | 2000-04-18 |
EP0810585A2 (en) | 1997-12-03 |
EP0810585A3 (en) | 1998-11-11 |
KR100218214B1 (ko) | 1999-09-01 |
TW317631B (en) | 1997-10-11 |
CA2194513C (en) | 2001-05-15 |
CA2194513A1 (en) | 1997-11-30 |
CN1170189A (zh) | 1998-01-14 |
DE69720855D1 (de) | 2003-05-22 |
EP0810585B1 (en) | 2003-04-16 |
JP3364825B2 (ja) | 2003-01-08 |
JPH09319396A (ja) | 1997-12-12 |
CN1151491C (zh) | 2004-05-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR970076487A (ko) | 음성 부호화 장치 및 음성 부호화 복호화 장치 | |
KR970024627A (ko) | 음성부호화방법 및 장치 | |
KR0169020B1 (ko) | 음성부호화장치, 음성복호화장치, 음성부호화복호화방법 및 이들에 사용가능한 위상진폭특성 도출장치 | |
JP5208901B2 (ja) | 音声信号および音楽信号を符号化する方法 | |
KR970003109A (ko) | 음성 신호의 재생 방법 및 장치와 그 전송 방법 | |
JP4263412B2 (ja) | 音声符号変換方法 | |
MY129887A (en) | Method and apparatus for performing reduced rate variable rate vocoding | |
KR20040028932A (ko) | 음성 대역 확장 장치 및 음성 대역 확장 방법 | |
US5826221A (en) | Vocal tract prediction coefficient coding and decoding circuitry capable of adaptively selecting quantized values and interpolation values | |
JP4727413B2 (ja) | 音声符号化・復号装置 | |
JP2001051699A (ja) | 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体 | |
JPS6238500A (ja) | 高能率音声符号化方式とその装置 | |
JPH08234795A (ja) | 音声符号化装置 | |
TWI279774B (en) | Adaptive pulse allocation mechanism for multi-pulse CELP coder | |
JPH05165500A (ja) | 音声符号化方法 | |
JP3041325B1 (ja) | 音声符号化装置及び音声復号化装置 | |
JP2853170B2 (ja) | 音声符号化復号化方式 | |
JP3166697B2 (ja) | 音声符号化・復号装置及びシステム | |
KR970031381A (ko) | 코드 여기 선형 예측 부호화의 잡음 코드북 작성 방법 | |
JP2001265390A (ja) | 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法 | |
JP2008090311A (ja) | 音声符号化方法 | |
JP2508002B2 (ja) | 音声符号化方法とその装置 | |
JPH05289700A (ja) | 音声符号化装置 | |
JP2844590B2 (ja) | 音声符号化方式とその装置 | |
JP3017747B2 (ja) | 音声符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20060525 Year of fee payment: 8 |
|
LAPS | Lapse due to unpaid annual fee |