KR970076487A - 음성 부호화 장치 및 음성 부호화 복호화 장치 - Google Patents

음성 부호화 장치 및 음성 부호화 복호화 장치 Download PDF

Info

Publication number
KR970076487A
KR970076487A KR1019970001026A KR19970001026A KR970076487A KR 970076487 A KR970076487 A KR 970076487A KR 1019970001026 A KR1019970001026 A KR 1019970001026A KR 19970001026 A KR19970001026 A KR 19970001026A KR 970076487 A KR970076487 A KR 970076487A
Authority
KR
South Korea
Prior art keywords
sound source
vector
speech
generating
frame
Prior art date
Application number
KR1019970001026A
Other languages
English (en)
Other versions
KR100218214B1 (ko
Inventor
다다시 야마우라
히로히사 다사끼
신야 다까하시
Original Assignee
기따오까 다까시
미쯔비시 덴끼 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 기따오까 다까시, 미쯔비시 덴끼 가부시끼가이샤 filed Critical 기따오까 다까시
Publication of KR970076487A publication Critical patent/KR970076487A/ko
Application granted granted Critical
Publication of KR100218214B1 publication Critical patent/KR100218214B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0011Long term prediction filters, i.e. pitch estimation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

음성 부호화시 합성 음성의 품질의 열화를 회피하고, 적은 연산량으로 품질이 우수한 합성 음성을 생성할 수 있는 음성 부호화 장치를 성취한다.
음성 부호화 장치는, 입력 음성으로부터 지연 파라미타에 대응한 벡터 길이의 목표 음성 벡터를 생성하는 목표 음성 생성 수단과, 과거에 생성한 음원 신호로부터 상기 지연 파라미타에 대응한 벡터 길이의 적응 음원 벡터를 생성하는 적응 음원 부호 장부와, 상기 적응 음원 벡터로부터 취득된 합성 음성 벡터의 상기 목표 음성 벡터의 대한 왜곡을 평가하여, 왜곡이 최소가 되는 적응 음원 벡터를 탐색하는 적응 음원 탐색 수단과, 상기 왜곡이 최소가 되는 적응 음원 벡터로부터 프레임 길이의 음원 신호를 생성하는 프레임 음원 생성 수단을 구비한다.

Description

음성 부호화 장치 및 음성 부호화 복호화 장치
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 본 발명 실시형태 1인 음성 부호화 장치 및 음성 복호화 장치의 전체 구성을 도시하는 흐름도.

Claims (4)

  1. 입력 음성을 스텍트럼 포락 정보와 음원 신호 정보로 분리하여, 프레임 단위로 음원 신호 정보를 부호화하는 음성 부호화 장치에 있어서, 입력 음성으로부터 지연 파라미터에 대응한 벡터 길이의 목표 음성 벡터를 생성하는 목표 음성 생성 수단과, 과거에 생성한 음원 신호로부터 상기 지연 파라미타에 대응한 벡터 길이의 적응 음원 벡터를 생성하는 적응 음원 부호 장부와, 상기 적응 음원 벡터로부터 취득되는 합성 음성 벡터의 상기 목표 음성 벡터에 대한 왜곡을 평가하여, 왜곡이 최소가 되는 적응 음원 벡터를 탐색하는 적응 음원 탐색수단과, 상기 왜곡이 최소가 되는 적응 음원 벡터로부터 프레임 길이의 음원 신호를 생성하는 프레임 음원 생성 수단을 구비한 것을 특징으로 하는 음성 부호화 장치.
  2. 입력 음성을 스텍트럼 포락 정보와 음원 신호 정보로 분리하여, 프레임 단위로 음원 신호 정보를 부호화하는 음성 부호화 장치에 있어서, 입력 음성으로부터 지연 파라미타에 대응한 벡터 길이의 목표 음성 벡터를 생성하는 목표 음성 생성 수단과, 지연 파라미타에 대응한 벡터 길이의 구동 음원 벡터를 생성하는 구동 음원 부호 장부와, 상기 구동 음원 벡터로부터 취득되는 합성 음성 벡터의 상기 목표 음성 벡터에 대한 왜곡을 평가하여 왜곡이 최소가 되는 구동 음원 벡터를 탐색하는 구동 음원 탐색 수단과, 상기 왜곡이 최소가 되는 구동음원 벡터로부터 프레임 길이의 음원 신호를 생성하는 프레임 음원 생성 수단을 포함하는 것을 특징으로 하는 음성 부호화 장치.
  3. 입력 음성을 스펙트럼 포락 정보와 음원 신호 정보로 분리하여, 프레임 단위로 음원 신호 정보를 부호화하고, 부호화된 음원 신호 정보를 복호화하여 출력 음성을 생성하는 음성 부호화 복호화 장치에 있어서, 부호화측에 입력 음성으로부터 지연 파라미타에 대응한 벡터 길이의 목표 음성 벡터를 생성하는 목표 음성 생성 수단과, 과거에 생성한 음원 신호로부터 상기 지연 파라미타에 대응한 벡터 길이의 적응 음원 벡터를 생성하는 적응 음원 부호 장부와, 상기 적응 음원 벡터로부터 취득되는 합성 음성 벡터의 상기 목표 음성 벡터에 대한 왜곡을 평가하여, 왜곡이 최소가 되는 적응 음원 벡터를 탐색하는 적응 음원 탐색 수단과, 상기 왜곡이 최소가 되는 적응 음원 벡터로부터 프레임 길이의 음원 신호를 생성하는 프레임 음원 생성 수단을 구비하는 한편, 복호화측에서 지연 파라미타에 대응한 벡터 길이의 적응 음원 벡터를 생성하는 적응 음원 부호 장부와, 적응 음원 벡터로부터 프레임 길이의 음원 신호를 생성하는 프레임 음원 생성 수단을 포함하는 것을 특징으로 하는 음성 부호화 복호화 장치.
  4. 입력 음성을 스펙트럼 포락 정보와 음원 신호 정보로 분리하여, 프레임 단위로 음원 신호 정보를 부호화하여, 부호화된 음원 신호 정보를 복호하하여 출력 음성을 생성하는 음성 부호화 복호화 장치에 있어서, 부호화측에서 입력 음성으로부터 지연 파라미타에 대응한 벡터 길이의 목표 음성 벡터를 생성하는 목표 음성 생성수단과, 지연 파라미타에 대응한 벡터 길이의 구동 음원 벡터를 생성하는 구동 음원 부호 장부와, 상기 구동 음원 벡터로부터 취득되는 합성 음성 벡터의 상기 목표 음성 벡터에 대한 왜곡을 평가하여, 왜곡이 최소가 되는 구동 음원 벡터를 탐색하는 구동 음원 탐색 수단과, 상기 왜곡이 최소가 되는 구동 음원 벡터로부터 프레임 길이의 음원 신호를 생성하는 프레임 음원 생성 수단을 포함하는 한편, 복호화측에서는, 지연 파라미터에 대응한 벡터 길이의 구동 음원 벡터를 생성하는 구동음원 부호 장부와, 구동 음원 벡터로부터 프레임 길이의 음원 신호를 생성하는 프레임 음원 생성 수단을 포함하는 것을 특징으로 하는 음성 부호화 복호화 장치.
    ※참고사항 : 최초출원 내용에 의하여 공개하는 것임.
KR1019970001026A 1996-05-29 1997-01-15 음성 부호화 장치 및 음성 부호화 복호화 장치 KR100218214B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP13524096A JP3364825B2 (ja) 1996-05-29 1996-05-29 音声符号化装置および音声符号化復号化装置
JP96-135240 1996-05-29

Publications (2)

Publication Number Publication Date
KR970076487A true KR970076487A (ko) 1997-12-12
KR100218214B1 KR100218214B1 (ko) 1999-09-01

Family

ID=15147096

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019970001026A KR100218214B1 (ko) 1996-05-29 1997-01-15 음성 부호화 장치 및 음성 부호화 복호화 장치

Country Status (8)

Country Link
US (1) US6052661A (ko)
EP (1) EP0810585B1 (ko)
JP (1) JP3364825B2 (ko)
KR (1) KR100218214B1 (ko)
CN (1) CN1151491C (ko)
CA (1) CA2194513C (ko)
DE (1) DE69720855D1 (ko)
TW (1) TW317631B (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100886062B1 (ko) * 1997-10-22 2009-02-26 파나소닉 주식회사 확산 펄스 벡터 생성 장치 및 방법

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19729494C2 (de) * 1997-07-10 1999-11-04 Grundig Ag Verfahren und Anordnung zur Codierung und/oder Decodierung von Sprachsignalen, insbesondere für digitale Diktiergeräte
CN1494055A (zh) * 1997-12-24 2004-05-05 ������������ʽ���� 声音编码方法和声音译码方法以及声音编码装置和声音译码装置
JP3268750B2 (ja) * 1998-01-30 2002-03-25 株式会社東芝 音声合成方法及びシステム
US6249758B1 (en) * 1998-06-30 2001-06-19 Nortel Networks Limited Apparatus and method for coding speech signals by making use of voice/unvoiced characteristics of the speech signals
US7072832B1 (en) 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6507814B1 (en) 1998-08-24 2003-01-14 Conexant Systems, Inc. Pitch determination using speech classification and prior pitch estimation
US6330533B2 (en) 1998-08-24 2001-12-11 Conexant Systems, Inc. Speech encoder adaptively applying pitch preprocessing with warping of target signal
US6449590B1 (en) 1998-08-24 2002-09-10 Conexant Systems, Inc. Speech encoder using warping in long term preprocessing
FI111438B (fi) * 1999-07-09 2003-07-15 Nokia Corp Symbolijonon lähetysmenetelmä
JP4792613B2 (ja) * 1999-09-29 2011-10-12 ソニー株式会社 情報処理装置および方法、並びに記録媒体
JP3404024B2 (ja) 2001-02-27 2003-05-06 三菱電機株式会社 音声符号化方法および音声符号化装置
JP4948401B2 (ja) * 2005-05-31 2012-06-06 パナソニック株式会社 スケーラブル符号化装置およびスケーラブル符号化方法
US7966190B2 (en) * 2005-07-11 2011-06-21 Lg Electronics Inc. Apparatus and method for processing an audio signal using linear prediction
WO2009039897A1 (en) * 2007-09-26 2009-04-02 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V. Apparatus and method for extracting an ambient signal in an apparatus and method for obtaining weighting coefficients for extracting an ambient signal and computer program
EP3301677B1 (en) 2011-12-21 2019-08-28 Huawei Technologies Co., Ltd. Very short pitch detection and coding
EP2862167B1 (en) * 2012-06-14 2018-08-29 Telefonaktiebolaget LM Ericsson (publ) Method and arrangement for scalable low-complexity audio coding
CN106448688B (zh) 2014-07-28 2019-11-05 华为技术有限公司 音频编码方法及相关装置
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP2980795A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4910781A (en) 1987-06-26 1990-03-20 At&T Bell Laboratories Code excited linear predictive vocoder using virtual searching
US5235670A (en) * 1990-10-03 1993-08-10 Interdigital Patents Corporation Multiple impulse excitation speech encoder and decoder
US5195168A (en) * 1991-03-15 1993-03-16 Codex Corporation Speech coder and method having spectral interpolation and fast codebook search
JP3275247B2 (ja) * 1991-05-22 2002-04-15 日本電信電話株式会社 音声符号化・復号化方法
US5396576A (en) * 1991-05-22 1995-03-07 Nippon Telegraph And Telephone Corporation Speech coding and decoding methods using adaptive and random code books
US5305421A (en) * 1991-08-28 1994-04-19 Itt Corporation Low bit rate speech coding system and compression
FI95085C (fi) * 1992-05-11 1995-12-11 Nokia Mobile Phones Ltd Menetelmä puhesignaalin digitaaliseksi koodaamiseksi sekä puhekooderi menetelmän suorittamiseksi
JPH07334194A (ja) * 1994-06-14 1995-12-22 Matsushita Electric Ind Co Ltd 音声符号化/復号化方法およびそれらの装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100886062B1 (ko) * 1997-10-22 2009-02-26 파나소닉 주식회사 확산 펄스 벡터 생성 장치 및 방법

Also Published As

Publication number Publication date
US6052661A (en) 2000-04-18
EP0810585A2 (en) 1997-12-03
EP0810585A3 (en) 1998-11-11
KR100218214B1 (ko) 1999-09-01
TW317631B (en) 1997-10-11
CA2194513C (en) 2001-05-15
CA2194513A1 (en) 1997-11-30
CN1170189A (zh) 1998-01-14
DE69720855D1 (de) 2003-05-22
EP0810585B1 (en) 2003-04-16
JP3364825B2 (ja) 2003-01-08
JPH09319396A (ja) 1997-12-12
CN1151491C (zh) 2004-05-26

Similar Documents

Publication Publication Date Title
KR970076487A (ko) 음성 부호화 장치 및 음성 부호화 복호화 장치
KR970024627A (ko) 음성부호화방법 및 장치
KR0169020B1 (ko) 음성부호화장치, 음성복호화장치, 음성부호화복호화방법 및 이들에 사용가능한 위상진폭특성 도출장치
JP5208901B2 (ja) 音声信号および音楽信号を符号化する方法
KR970003109A (ko) 음성 신호의 재생 방법 및 장치와 그 전송 방법
JP4263412B2 (ja) 音声符号変換方法
MY129887A (en) Method and apparatus for performing reduced rate variable rate vocoding
KR20040028932A (ko) 음성 대역 확장 장치 및 음성 대역 확장 방법
US5826221A (en) Vocal tract prediction coefficient coding and decoding circuitry capable of adaptively selecting quantized values and interpolation values
JP4727413B2 (ja) 音声符号化・復号装置
JP2001051699A (ja) 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体
JPS6238500A (ja) 高能率音声符号化方式とその装置
JPH08234795A (ja) 音声符号化装置
TWI279774B (en) Adaptive pulse allocation mechanism for multi-pulse CELP coder
JPH05165500A (ja) 音声符号化方法
JP3041325B1 (ja) 音声符号化装置及び音声復号化装置
JP2853170B2 (ja) 音声符号化復号化方式
JP3166697B2 (ja) 音声符号化・復号装置及びシステム
KR970031381A (ko) 코드 여기 선형 예측 부호화의 잡음 코드북 작성 방법
JP2001265390A (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
JP2008090311A (ja) 音声符号化方法
JP2508002B2 (ja) 音声符号化方法とその装置
JPH05289700A (ja) 音声符号化装置
JP2844590B2 (ja) 音声符号化方式とその装置
JP3017747B2 (ja) 音声符号化装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20060525

Year of fee payment: 8

LAPS Lapse due to unpaid annual fee