KR970017173A - 음성합성방법 및 장치 - Google Patents

음성합성방법 및 장치 Download PDF

Info

Publication number
KR970017173A
KR970017173A KR1019960042737A KR19960042737A KR970017173A KR 970017173 A KR970017173 A KR 970017173A KR 1019960042737 A KR1019960042737 A KR 1019960042737A KR 19960042737 A KR19960042737 A KR 19960042737A KR 970017173 A KR970017173 A KR 970017173A
Authority
KR
South Korea
Prior art keywords
sound
harmonics
fundamental wave
frame
speech synthesis
Prior art date
Application number
KR1019960042737A
Other languages
English (en)
Other versions
KR100406674B1 (ko
Inventor
타카시 이다
미노루 타카하시
겐 가와하따
마사유끼 니시구찌
준 마쯔모또
Original Assignee
아키모토 유우미
미쓰비시마테리아루 카부시키가이샤
아베 아끼라
가부시키가이샤 프론테크
이데이 노브유끼
소니 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 아키모토 유우미, 미쓰비시마테리아루 카부시키가이샤, 아베 아끼라, 가부시키가이샤 프론테크, 이데이 노브유끼, 소니 가부시끼가이샤 filed Critical 아키모토 유우미
Publication of KR970017173A publication Critical patent/KR970017173A/ko
Application granted granted Critical
Publication of KR100406674B1 publication Critical patent/KR100406674B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/093Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Abstract

정현파 합성기술을 이용하여 구성된 음성합성방법 및 장치는 정현파를 합성시 위상의 변환으로 야기되는 음질의 열화를 방지하도록 구성되어 있다. 복호화처리부는 부호화측으로부터의 데이터를 디코드 한다. 복호화데이터는 배드프레임 마스크처리부를 통해서 유성음/무성음데이터로 변환된다. 그런다음, 무성음검출회로는 상기 데이터에서 무성음프레임을 검출한다. 두개 이상의 연속하는 무성음프레임이 존재하는 경우, 유성음합성부는 기본파 및 그 고조파의 위상을 0또는 π/2등의 주어진 값으로 초기화시킨다. 이는 유성음프레임의 시점에서 무성음과 유성음사이에 변환된 위상을 초기화함으로써, 위상의 엇갈림으로 야기되는 합성음의 찌그러짐 등 음질의 열화를 방지할 수 있도록 해준다.

Description

음성합성방법 및 장치
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 본 발명을 따르는 음성신호에 대한 분석/합성 부호화장치중 분석측(엔코드측)의 개략구성을 나타내는 기능블록도,

Claims (10)

  1. 음성신호에서 얻어진 입력신호를 프레임단위로 구분하고, 각 구분된 프레임에 대하여 피치를 구하고, 유성음을 함유하는지 무성음을 함유하는지가 결정된 데이터에서 음성을 합성하는 단계들을 취하도록 구성된 음성합성방법에 있어서, 상기 프레임이 유성음을 함유하는 것으로 판별되는 경우에는 유성음을 피치의 기본파 및 그 고조파와 합성하는 단계와, 상기 프레임이 무성음을 함유하는 것으로 판별되는 경우에는 상기 기본파 및 그 고조파의 위상을 주어진 값으로 초기화 하는 단계와, 를 포함하여 구성된 것을 특징으로 하는 음성합성방법.
  2. 제1항에 있어서, 무성음을 함유하는 것으로 판별되는 프레임을 유성음을 함유하는 것으로 판별되는 프레임으로 변환하는 시점에서 기본파 및 그 고조파의 위상을 초기화하는 것을 특징으로 하는 음성합성방법.
  3. 제1항에 있어서, 무성음을 함유하는 것으로 판별되는 두개 이상의 연속하는 프레임이 존재하는 경우, 기본파 및 그 고조파의 위상을 초기화하는 것을 특징으로 하는 음성합성방법.
  4. 제1항에 있어서, 상기 입력신호는 음성신호에 대해서 선형예측부호화동작을 수행함으로써 얻어진 선형예측부호화 잔차신호인 것을 특징으로 하는 음성합성방법,
  5. 제1항에 있어서, 기본파 및 그 고조파의 위상을 0또는 π/2로 초기화하는 것을 특징으로 하는 음성합성방법.
  6. 음성신호에서 얻어진 입력신호를 프레임단위로 구분하고, 각 프레임에 대해 피치를 구하고, 유성음을 함유하는지 무성음을 함유하는지가 결정된 데이터에서 음성을 합성하도록 구성된 음성합성장치에 있어서, 상기 프레임이 유성음을 함유하는 것이라 판별되는 경우에는 유성음을 피치의 기본파 및 그 고조파와 합성하는 수단과, 상기 프레임이 무성음을 함유하는 것이라 판별되는 경우에는 상기 기본파 및 그 고조파의 위상을 주어진 값으로 초기화하는 수단과, 를 포함하여 구성된 것을 특징으로 하는 음성합성장치.
  7. 제6항에 있어서, 상기 초기화수단은 무성음을 함유하는 것이라 판별되는 프레임을 유성음을 함유하는 프레임으로 변환하는 시점에서 상기 기본파 및 그 고조파의 위상을 초기화하는 것을 특징으로 하는 음성합성장치.
  8. 제6항에 있어서, 무성음을 함유하는 것이라 판별되는 두개 이상의 프레임이 존재하는 경우, 상기 기본파 및 그 고조파의 위상을 초기화하는 것을 특징으로 하는 음성합성장치.
  9. 제6항에 있어서 상기 초기화수단은 상기 기본파 및 그 고조파의 위상을 0 또는 π/2로 초기화하는 것을 특징으로 하는 음성합성장치.
  10. 제6항에 있어서, 상기 입력신호는 음성신호에 대하여 선형예측부호화동작을 수행함으로써 얻어진 선형 예측부호화 전자신호인 것을 특징으로 하는 음성합성장치
    ※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
KR1019960042737A 1995-09-28 1996-09-25 음성합성방법 및 장치 KR100406674B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP7-230562 1995-09-07
JP95-235817 1995-09-13
JP25098395A JP3680374B2 (ja) 1995-09-28 1995-09-28 音声合成方法
JP95-250983 1995-09-28

Publications (2)

Publication Number Publication Date
KR970017173A true KR970017173A (ko) 1997-04-30
KR100406674B1 KR100406674B1 (ko) 2004-01-28

Family

ID=17215938

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019960042737A KR100406674B1 (ko) 1995-09-28 1996-09-25 음성합성방법 및 장치

Country Status (8)

Country Link
US (1) US6029134A (ko)
EP (1) EP0766230B1 (ko)
JP (1) JP3680374B2 (ko)
KR (1) KR100406674B1 (ko)
CN (1) CN1132146C (ko)
BR (1) BR9603941A (ko)
DE (1) DE69618408T2 (ko)
NO (1) NO312428B1 (ko)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6240384B1 (en) * 1995-12-04 2001-05-29 Kabushiki Kaisha Toshiba Speech synthesis method
JP3055608B2 (ja) * 1997-06-06 2000-06-26 日本電気株式会社 音声符号化方法および装置
US6449592B1 (en) 1999-02-26 2002-09-10 Qualcomm Incorporated Method and apparatus for tracking the phase of a quasi-periodic signal
SE9903223L (sv) * 1999-09-09 2001-05-08 Ericsson Telefon Ab L M Förfarande och anordning i telekommunikationssystem
KR100711047B1 (ko) * 2000-02-29 2007-04-24 퀄컴 인코포레이티드 폐루프 멀티모드 혼합영역 선형예측 (mdlp) 음성 코더
KR100711040B1 (ko) * 2000-02-29 2007-04-24 퀄컴 인코포레이티드 유사주기 신호의 위상을 추적하는 방법 및 장치
WO2004082288A1 (en) * 2003-03-11 2004-09-23 Nokia Corporation Switching between coding schemes
JP4992717B2 (ja) * 2005-09-06 2012-08-08 日本電気株式会社 音声合成装置及び方法とプログラム
JP2007114417A (ja) * 2005-10-19 2007-05-10 Fujitsu Ltd 音声データ処理方法及び装置
EP1918911A1 (en) * 2006-11-02 2008-05-07 RWTH Aachen University Time scale modification of an audio signal
US8121835B2 (en) * 2007-03-21 2012-02-21 Texas Instruments Incorporated Automatic level control of speech signals
WO2009004727A1 (ja) * 2007-07-04 2009-01-08 Fujitsu Limited 符号化装置、符号化方法および符号化プログラム
JP5262171B2 (ja) 2008-02-19 2013-08-14 富士通株式会社 符号化装置、符号化方法および符号化プログラム
CN102103855B (zh) * 2009-12-16 2013-08-07 北京中星微电子有限公司 一种检测音频片段的方法及装置
WO2012006770A1 (en) * 2010-07-12 2012-01-19 Huawei Technologies Co., Ltd. Audio signal generator
JP2012058358A (ja) * 2010-09-07 2012-03-22 Sony Corp 雑音抑圧装置、雑音抑圧方法およびプログラム
WO2016142002A1 (en) * 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
CN111862931A (zh) * 2020-05-08 2020-10-30 北京嘀嘀无限科技发展有限公司 一种语音生成方法及装置
CN112820267B (zh) * 2021-01-15 2022-10-04 科大讯飞股份有限公司 波形生成方法以及相关模型的训练方法和相关设备、装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1242279A (en) * 1984-07-10 1988-09-20 Tetsu Taguchi Speech signal processor
US5179626A (en) * 1988-04-08 1993-01-12 At&T Bell Laboratories Harmonic speech coding arrangement where a set of parameters for a continuous magnitude spectrum is determined by a speech analyzer and the parameters are used by a synthesizer to determine a spectrum which is used to determine senusoids for synthesis
US5081681B1 (en) * 1989-11-30 1995-08-15 Digital Voice Systems Inc Method and apparatus for phase synthesis for speech processing
US5216747A (en) * 1990-09-20 1993-06-01 Digital Voice Systems, Inc. Voiced/unvoiced estimation of an acoustic signal
US5226108A (en) * 1990-09-20 1993-07-06 Digital Voice Systems, Inc. Processing a speech signal with estimated pitch
US5664051A (en) * 1990-09-24 1997-09-02 Digital Voice Systems, Inc. Method and apparatus for phase synthesis for speech processing
JP3218679B2 (ja) * 1992-04-15 2001-10-15 ソニー株式会社 高能率符号化方法
JP3277398B2 (ja) * 1992-04-15 2002-04-22 ソニー株式会社 有声音判別方法
US5504834A (en) * 1993-05-28 1996-04-02 Motrola, Inc. Pitch epoch synchronous linear predictive coding vocoder and method
JP3338885B2 (ja) * 1994-04-15 2002-10-28 松下電器産業株式会社 音声符号化復号化装置

Also Published As

Publication number Publication date
EP0766230B1 (en) 2002-01-09
EP0766230A3 (en) 1998-06-03
BR9603941A (pt) 1998-06-09
EP0766230A2 (en) 1997-04-02
CN1157452A (zh) 1997-08-20
KR100406674B1 (ko) 2004-01-28
DE69618408T2 (de) 2002-08-29
CN1132146C (zh) 2003-12-24
DE69618408D1 (de) 2002-02-14
JP3680374B2 (ja) 2005-08-10
NO963935D0 (no) 1996-09-19
NO963935L (no) 1997-04-01
US6029134A (en) 2000-02-22
JPH0990968A (ja) 1997-04-04
NO312428B1 (no) 2002-05-06

Similar Documents

Publication Publication Date Title
KR970017173A (ko) 음성합성방법 및 장치
KR960032298A (ko) 재생 위상 정보를 사용하는 음성 합성 방법 및 장치
CN101184979B (zh) 用于高频带激励产生的系统、方法和设备
EP0770987A2 (en) Method and apparatus for reproducing speech signals, method and apparatus for decoding the speech, method and apparatus for synthesizing the speech and portable radio terminal apparatus
MX9605122A (es) Metodo y aparato de codificacion de voz y metodo y aparato de descodificacion de voz.
MX9602391A (es) Metodo y aparato para reproducir señales de conversacion y metodo para transmitirlas.
US20220005486A1 (en) Encoding apparatus and decoding apparatus for transforming between modified discrete cosine transform-based coder and different coder
KR950013027A (ko) 채널 오디오 신호 부호화 방법
JPH11177434A (ja) 音声符号化復号方式
KR960702220A (ko) 정보 부호화 방법 및 장치와 정보 복호화 방법 및 장치(Information encoding method and apparatus, and information decoding method and apparatus)
EP0384587B1 (en) Voice synthesizing apparatus
KR20030007528A (ko) 스펙트럼 향상을 구현하기 위한 방법 및 장치
JP3088204B2 (ja) コード励振線形予測符号化装置及び復号化装置
McCree et al. Implementation and evaluation of a 2400 bit/s mixed excitation LPC vocoder
JPH05165500A (ja) 音声符号化方法
Vera-Candeas et al. Sinusoidal modelling using perceptual matching pursuits in the bark scale for parametric audio coding
KR920005063A (ko) 범용 마이크로 프로세서를 이용한 음성분석 및 합성장치
KR0155805B1 (ko) 부프레임별 유/무성 대역 정보를 이용한 음성합성 방법
Andreotti et al. A 6.3 kb/s CELP codec suitable for half-rate system
KR920003934B1 (ko) 음성합성기의 복합코딩방법
Katugampala et al. A hybrid coder based on a new phase model for synchronization between harmonic and waveform coded segments
KR970017171A (ko) 음성합성방법
JPS61259300A (ja) 音声合成方式
KR930014260A (ko) 음성 합성 시스템
KR920013944A (ko) 음성부호화 방법

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20131101

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20141105

Year of fee payment: 12

LAPS Lapse due to unpaid annual fee