KR970017173A

KR970017173A - 음성합성방법 및 장치

Info

Publication number: KR970017173A
Application number: KR1019960042737A
Authority: KR
Inventors: 타카시 이다; 미노루 타카하시; 겐 가와하따; 마사유끼 니시구찌; 준 마쯔모또
Original assignee: 아키모토 유우미; 미쓰비시마테리아루 카부시키가이샤; 아베 아끼라; 가부시키가이샤 프론테크; 이데이 노브유끼; 소니 가부시끼가이샤
Priority date: 1995-09-07
Filing date: 1996-09-25
Publication date: 1997-04-30
Also published as: EP0766230B1; EP0766230A3; BR9603941A; EP0766230A2; CN1157452A; KR100406674B1; DE69618408T2; CN1132146C; DE69618408D1; JP3680374B2; NO963935D0; NO963935L; US6029134A; JPH0990968A; NO312428B1

Abstract

정현파 합성기술을 이용하여 구성된 음성합성방법 및 장치는 정현파를 합성시 위상의 변환으로 야기되는 음질의 열화를 방지하도록 구성되어 있다. 복호화처리부는 부호화측으로부터의 데이터를 디코드 한다. 복호화데이터는 배드프레임 마스크처리부를 통해서 유성음/무성음데이터로 변환된다. 그런다음, 무성음검출회로는 상기 데이터에서 무성음프레임을 검출한다. 두개 이상의 연속하는 무성음프레임이 존재하는 경우, 유성음합성부는 기본파 및 그 고조파의 위상을 0또는 π/2등의 주어진 값으로 초기화시킨다. 이는 유성음프레임의 시점에서 무성음과 유성음사이에 변환된 위상을 초기화함으로써, 위상의 엇갈림으로 야기되는 합성음의 찌그러짐 등 음질의 열화를 방지할 수 있도록 해준다.

Description

음성합성방법 및 장치

본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음

제1도는 본 발명을 따르는 음성신호에 대한 분석/합성 부호화장치중 분석측(엔코드측)의 개략구성을 나타내는 기능블록도,

Claims

음성신호에서 얻어진 입력신호를 프레임단위로 구분하고, 각 구분된 프레임에 대하여 피치를 구하고, 유성음을 함유하는지 무성음을 함유하는지가 결정된 데이터에서 음성을 합성하는 단계들을 취하도록 구성된 음성합성방법에 있어서, 상기 프레임이 유성음을 함유하는 것으로 판별되는 경우에는 유성음을 피치의 기본파 및 그 고조파와 합성하는 단계와, 상기 프레임이 무성음을 함유하는 것으로 판별되는 경우에는 상기 기본파 및 그 고조파의 위상을 주어진 값으로 초기화 하는 단계와, 를 포함하여 구성된 것을 특징으로 하는 음성합성방법.
제1항에 있어서, 무성음을 함유하는 것으로 판별되는 프레임을 유성음을 함유하는 것으로 판별되는 프레임으로 변환하는 시점에서 기본파 및 그 고조파의 위상을 초기화하는 것을 특징으로 하는 음성합성방법.
제1항에 있어서, 무성음을 함유하는 것으로 판별되는 두개 이상의 연속하는 프레임이 존재하는 경우, 기본파 및 그 고조파의 위상을 초기화하는 것을 특징으로 하는 음성합성방법.
제1항에 있어서, 상기 입력신호는 음성신호에 대해서 선형예측부호화동작을 수행함으로써 얻어진 선형예측부호화 잔차신호인 것을 특징으로 하는 음성합성방법,
제1항에 있어서, 기본파 및 그 고조파의 위상을 0또는 π/2로 초기화하는 것을 특징으로 하는 음성합성방법.
음성신호에서 얻어진 입력신호를 프레임단위로 구분하고, 각 프레임에 대해 피치를 구하고, 유성음을 함유하는지 무성음을 함유하는지가 결정된 데이터에서 음성을 합성하도록 구성된 음성합성장치에 있어서, 상기 프레임이 유성음을 함유하는 것이라 판별되는 경우에는 유성음을 피치의 기본파 및 그 고조파와 합성하는 수단과, 상기 프레임이 무성음을 함유하는 것이라 판별되는 경우에는 상기 기본파 및 그 고조파의 위상을 주어진 값으로 초기화하는 수단과, 를 포함하여 구성된 것을 특징으로 하는 음성합성장치.
제6항에 있어서, 상기 초기화수단은 무성음을 함유하는 것이라 판별되는 프레임을 유성음을 함유하는 프레임으로 변환하는 시점에서 상기 기본파 및 그 고조파의 위상을 초기화하는 것을 특징으로 하는 음성합성장치.
제6항에 있어서, 무성음을 함유하는 것이라 판별되는 두개 이상의 프레임이 존재하는 경우, 상기 기본파 및 그 고조파의 위상을 초기화하는 것을 특징으로 하는 음성합성장치.
제6항에 있어서 상기 초기화수단은 상기 기본파 및 그 고조파의 위상을 0 또는 π/2로 초기화하는 것을 특징으로 하는 음성합성장치.
제6항에 있어서, 상기 입력신호는 음성신호에 대하여 선형예측부호화동작을 수행함으로써 얻어진 선형 예측부호화 전자신호인 것을 특징으로 하는 음성합성장치

※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.