KR20040070049A - 음원 장치 및 음성 합성 장치 - Google Patents

음원 장치 및 음성 합성 장치 Download PDF

Info

Publication number
KR20040070049A
KR20040070049A KR1020040005697A KR20040005697A KR20040070049A KR 20040070049 A KR20040070049 A KR 20040070049A KR 1020040005697 A KR1020040005697 A KR 1020040005697A KR 20040005697 A KR20040005697 A KR 20040005697A KR 20040070049 A KR20040070049 A KR 20040070049A
Authority
KR
South Korea
Prior art keywords
waveform data
formant
sound
waveform
voice
Prior art date
Application number
KR1020040005697A
Other languages
English (en)
Other versions
KR100602979B1 (ko
Inventor
가와하라다께히꼬
나까무라노부까즈
Original Assignee
야마하 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP2003021681A external-priority patent/JP3915703B2/ja
Priority claimed from JP2003021682A external-priority patent/JP3797333B2/ja
Priority claimed from JP2003021683A external-priority patent/JP3915704B2/ja
Priority claimed from JP2003021680A external-priority patent/JP2004233621A/ja
Application filed by 야마하 가부시키가이샤 filed Critical 야마하 가부시키가이샤
Publication of KR20040070049A publication Critical patent/KR20040070049A/ko
Application granted granted Critical
Publication of KR100602979B1 publication Critical patent/KR100602979B1/ko

Links

Classifications

    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02MAPPARATUS FOR CONVERSION BETWEEN AC AND AC, BETWEEN AC AND DC, OR BETWEEN DC AND DC, AND FOR USE WITH MAINS OR SIMILAR POWER SUPPLY SYSTEMS; CONVERSION OF DC OR AC INPUT POWER INTO SURGE OUTPUT POWER; CONTROL OR REGULATION THEREOF
    • H02M1/00Details of apparatus for conversion
    • H02M1/12Arrangements for reducing harmonics from ac input or output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H7/00Instruments in which the tones are synthesised from a data store, e.g. computer organs
    • G10H7/08Instruments in which the tones are synthesised from a data store, e.g. computer organs by calculating functions or polynomial approximations to evaluate amplitudes at successive sample points of a tone waveform
    • G10H7/10Instruments in which the tones are synthesised from a data store, e.g. computer organs by calculating functions or polynomial approximations to evaluate amplitudes at successive sample points of a tone waveform using coefficients or parameters stored in a memory, e.g. Fourier coefficients
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02MAPPARATUS FOR CONVERSION BETWEEN AC AND AC, BETWEEN AC AND DC, OR BETWEEN DC AND DC, AND FOR USE WITH MAINS OR SIMILAR POWER SUPPLY SYSTEMS; CONVERSION OF DC OR AC INPUT POWER INTO SURGE OUTPUT POWER; CONTROL OR REGULATION THEREOF
    • H02M7/00Conversion of ac power input into dc power output; Conversion of dc power input into ac power output
    • H02M7/42Conversion of dc power input into ac power output without possibility of reversal
    • H02M7/44Conversion of dc power input into ac power output without possibility of reversal by static converters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2250/00Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
    • G10H2250/471General musical sound synthesis principles, i.e. sound category-independent synthesis methods
    • G10H2250/481Formant synthesis, i.e. simulating the human speech production mechanism by exciting formant resonators, e.g. mimicking vocal tract filtering as in LPC synthesis vocoders, wherein musical instruments may be used as excitation signal to the time-varying filter estimated from a singer's speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • General Engineering & Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Algebra (AREA)
  • Power Engineering (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

고품위의 음성을 합성한다. 위상 데이터 발생기(20)로부터 출력되는 위상 데이터를 누산하는 어드레스 발생기(21)는 유성음 포만트 혹은 무성음 포만트의 중심 주파수의 레이트의 판독 어드레스를 출력하고, 이 판독 어드레스에 의해 파형 데이터 기억부(22)로부터 유성음 포만트 혹은 무성음 포만트를 형성하는 파형 데이터가 판독된다. 판독된 파형 데이터에는 승산기(23)에서 엔벨로프 신호가 승산되고, 무성음 포만트를 형성하는 파형 데이터에는 가산기(25)에 의해 노이즈가 가산된다. 이러한 복수개의 WT 보이스부(10)로부터 출력되는 유성음 포만트 혹은 무성음 포만트를 합성하는 것에 의해 음성이 합성된다.

Description

음원 장치 및 음성 합성 장치{VOICE SOURCE DEVICE AND VOICE SYNTHESIS DEVICE}
본 발명은, 악음을 발생시킬 수 있음과 함께 음성을 합성할 수 있는 음성 합성 기능을 갖춘 음원 장치에 관한 것이다. 또 본 발명은, 복수개의 포만트를 합성하여 음성을 합성할 수 있는 음성 합성 장치에 관한 것이다.
종래의 음원 장치에, 음성을 합성하는 기능을 갖추게 하기 위해서는, 음원 장치가 음성을 발생하는 기능을 갖추고 있지 않기 때문에, 음원 장치 내에 음성 합성 장치를 별도로 내장할 필요가 있었다. 종래의 음성 합성 장치의 일례로서는, 수 ms 내지 수십 ms의 단시간의 음성을 정상으로 간주하여 수개의 정현파의 합으로 표현하는 것을 원리로 하고 있다. 그리고, 정현파를 발생시키는 정현파 발생기의 위상을 피치 주기로 리세트하는 것에 의해 유성음을 형성하고, 정현파 발생기의 위상 초기화 타이밍을 랜덤하게 하는 것에 의해 스펙트럼을 확대하여 무성음을 형성하는 것이 알려져 있었다(예를 들면, 일본 특공소58-53351호 공보 참조).
그러나, 음원 장치에 음성 합성 장치를 별도로 내장하면 음원 장치의 하드웨어가 커짐과 함께, 가격도 비싸지는 문제점이 있었다. 또, 종래의 음성 합성 장치가 합성할 수 있는 음성의 품위가 낮아 리얼리티가 없다는 문제점이 있었다.
따라서, 본 발명은, 음성 합성 장치를 별도로 조립할 필요가 없음과 함께, 고 품위의 음성을 합성할 수 있는 음성 합성 기능을 갖추는 음원 장치를 제공하는 것을 목적으로 하고 있다.
또한 본 발명은, 고품위의 음성을 합성할 수 있는 음성 합성 장치를 제공하는 것을 목적으로 하고 있다.
도 1은 본 발명의 실시예의 음원 장치와 겸용되는 음성 합성 장치의 구성을 도시하는 블록도.
도 2는 본 발명의 실시예의 음원 장치와 겸용되는 음성 합성 장치에서의 WT 보이스부의 개략 구성을 도시하는 블록도.
도 3은 본 발명의 실시예의 음원 장치와 겸용되는 음성 합성 장치에서의 위상 데이터 발생기의 상세 구성을 도시하는 블록도.
도 4는 본 발명의 실시예의 음원 장치와 겸용되는 음성 합성 장치에서의 어드레스 발생기의 상세 구성을 도시하는 블록도.
도 5는 본 발명의 실시예의 음원 장치와 겸용되는 음성 합성 장치에서의 어드레스 발생기의 ADG 출력의 일례를 도시하는 그래프.
도 6은 본 발명의 실시예의 음원 장치와 겸용되는 음성 합성 장치에서의 어드레스 발생기의 ADG 출력의 다른 예를 도시하는 그래프.
도 7은 본 발명의 실시예의 음원 장치와 겸용되는 음성 합성 장치에서의 어드레스 발생기의 유성음 피치 신호의 파형을 도시하는 도면.
도 8은 본 발명의 실시예의 음원 장치와 겸용되는 음성 합성 장치에서의 어드레스 발생기의 ADG 출력의 또 다른 예를 도시하는 그래프.
도 9는 본 발명의 실시예의 음원 장치와 겸용되는 음성 합성 장치에서의 엔벨로프 발생기의 상세 구성을 도시하는 블록도.
도 10은 본 발명의 실시예의 음원 장치와 겸용되는 음성 합성 장치에서의 엔벨로프 발생기의 EG 출력의 일례를 도시하는 그래프.
도 11은 본 발명의 실시예의 음원 장치와 겸용되는 음성 합성 장치에서의 엔벨로프 발생기의 EG 출력의 다른 예를 도시하는 그래프.
도 12는 본 발명의 실시예의 음원 장치와 겸용되는 음성 합성 장치에서의 엔벨로프 발생기의 EG 출력의 또 다른 예를 도시하는 그래프.
도 13은 본 발명의 실시예의 음원 장치와 겸용되는 음성 합성 장치에서의 노이즈 발생부의 상세 구성을 도시하는 블록도.
도 14는 본 발명의 실시예의 음원 장치와 겸용되는 음성 합성 장치에서의 파형 데이터 기억부에 기억되어 있는 유성음 포만트 혹은 무성음 포만트를 형성하기 위한 복수 종류의 파형 데이터의 파형 형상의 일례를 도시하는 도면.
<도면의 주요 부분에 대한 부호의 설명>
1 : 음성 합성 장치
10, 10a, 10b, 10c, 10d, 10e, 10f, 10g, 10h, 10i : WT 보이스부
11 : 믹싱 수단
20 : 위상 데이터 발생기
21 : 어드레스 발생기
22 : 파형 데이터 기억부
23, 27, 75 : 승산기
25, 45, 47, 70d : 가산기
26 : 노이즈 발생부
30, 31, 32, 33, 42, 43, 44, 46, 49, 50, 60, 61, 62, 63, 64, 76 : 셀렉터
34 : 시프터
41, 65 : 누산기
43 : 감산기
48 : 스타트 어드레스 발생기
66 : 스테이트 제어부
70 : 백색 잡음 발생기
70a : 지연 회로
70b, 70c : 계수 승산기
71, 72, 73, 74 : 저역 통과 필터
77 : AND 게이트
AR : 어택 레이트
BLOCK : 옥타브 정보
DR : 디케이 레이트
EP : 엔드 포인트
FNUM : 주파수 정보
LP : 루프 포인트
RR : 릴리스 레이트
SA : 스타트 어드레스
SL : 서스테인 레벨
SR : 서스테인 레이트
상기 목적을 달성하기 위해, 본 발명의 제1 면에 관한 음원 장치는 웨이브 테이블 음원 모드 또는 음성 합성 모드 중 어느 하나를 나타내는 모드 지정에 따라, 원하는 악음 또는 원하는 포만트 중 어느 하나를 출력하는 복수개의 악음 형성부를 구비하고, 웨이브 테이블 음원 모드시에는 상기 복수개의 악음 형성부는 각각 악음을 발생시킬 수 있으며, 음성 합성 모드시에는 상기 복수개의 악음 형성부는 각각 포만트를 형성하고 또한 형성된 복수개의 포만트로부터 1개의 음성을 합성하는 음성 합성 기능을 갖춘다. 상기 복수개의 악음 형성부 각각은, 복수 종류의 파형 형상 중에서 원하는 파형 형상을 지정하는 파형 형상 지정 수단과, 상기 복수 종류의 파형 형상에 대응한 복수개의 파형 데이터를 기억하고 있는 파형 데이터 기억 수단과, 웨이브 테이블 음원 모드시에는 발생시켜야 할 악음의 음정에 대응한 레이트로 변화하는 어드레스를 발생시킴과 함께, 음성 합성 모드시에는 형성해야할 포만트의 중심 주파수에 대응한 레이트로 변화하는 어드레스를 발생시켜, 상기 파형 형상 지정 수단에 의해 지정된 파형 형상에 대응한 파형 데이터를 상기 파형 데이터 기억 수단으로부터 판독하는 파형 데이터 판독 수단과, 웨이브 테이블 음원 모드시에는 발음 개시 지시에 연동하여 상승함과 함께 발음 종료 지시에 연동하여 감쇠되는 엔벨로프 신호를 생성하고, 음성 합성 모드시에는 합성해야 할 음성의 피치 주기에 대응한 타이밍마다 급속하게 감쇠됨과 함께 감쇠 후에 급속하게 상승하는 형상의 엔벨로프 신호를 생성하고, 해당 생성한 엔벨로프 신호를 상기 파형 데이터 판독 수단에 의해 상기 파형 데이터 기억 수단으로부터 판독된 파형 데이터에 부여하는 엔벨로프 부여 수단을 포함하는 것을 특징으로 한다.
또한 본 발명에 따른 음원 장치는, 웨이브 테이블 음원 모드 또는 음성 합성 모드 중 어느 하나를 나타내는 모드 지정에 따라, 원하는 악음 또는 원하는 포만트 중 어느 하나를 출력하는 복수개의 악음 형성부를 구비하고, 웨이브 테이블 음원 모드시에는 상기 복수개의 악음 형성부는 각각 악음을 발생시킬 수 있고, 음성 합성 모드시에는 상기 복수개의 악음 형성부는 각각 포만트를 형성하고 또한 형성된 복수개의 포만트로부터 1개의 음성을 합성하는 음성 합성 기능을 갖춘다. 상기 복수개의 악음 형성부 각각은 복수 종류의 파형 형상 중에서 원하는 파형 형상을 지정하는 파형 형상 지정 수단과, 상기 복수 종류의 파형 형상에 대응한 복수개의 파형 데이터를 기억하고 있는 파형 데이터 기억 수단과, 웨이브 테이블 음원 모드시에는 발생하여야 할 악음의 음정에 대응한 레이트로 변화하는 어드레스를 발생시킴과 함께, 음성 합성 모드시에는 형성해야 할 포만트의 중심 주파수에 대응한 레이트로 변화하는 어드레스를 발생시켜, 상기 파형 형상 지정 수단에 의해 지정된 파형 형상에 대응한 파형 데이터를 상기 파형 데이터 기억 수단으로부터 판독하는 파형 데이터 판독 수단과, 발음 개시 지시에 연동하여 상승함과 함께 발음 종료 지시에 연동하여 감쇠되는 엔벨로프 신호를 생성하고, 해당 생성한 엔벨로프 신호를 상기 파형 데이터 판독 수단에 의해 상기 파형 데이터 기억 수단으로부터 판독된 파형 데이터에 부여하는 엔벨로프 부여 수단과, 음성 합성 모드시에, 상기 엔벨로프 부여 수단에 의해 엔벨로프 부여된 파형 데이터에 노이즈를 부여하는 노이즈 부여 수단을 포함하도록 한 것을 특징으로 한다.
이러한 본 발명의 제1면에 의하면, 웨이브 테이블 음원 모드시에는 복수개의 악음 형성부에 의해 각각 악음을 발생시킬 수 있고, 음성 합성 모드시에는 복수개의 악음 형성부에 의해 각각 형성된 복수개의 포만트를 합성하여 음성을 합성할 수 있다. 이와 같이, 복수개의 악음 형성부를 악음 발생과 음성 합성으로 겸용할 수 있기 때문에, 음원 장치에 음성 합성 장치별로 내장하지 않고 음원 장치에 음성 합성 기능을 갖출 수 있게 된다. 또한, 음성 합성 모드시에, 노이즈 부여 수단에 의해 노이즈를 포만트에 부여하는 것에 의해, 고품위의 리얼리티가 있는 음성을 합성할 수 있게 된다.
또한 본 발명의 제2면에서는, 원하는 포만트 중심 주파수 및 원하는 포만트 레벨을 갖는 포만트를 각각 형성하는 복수개의 포만트 형성부를 구비하고, 해당 복수개의 포만트 형성부에 의해 형성된 복수개의 포만트를 합성하는 것에 의해 음성을 합성하는 음성 합성 장치에서, 상기 복수개의 포만트 형성부 각각이, 소정의 파형 형상에 대응한 파형 데이터를 기억하고 있는 파형 데이터 기억 수단과, 상기 포만트 중심 주파수에 대응한 레이트로 변화하는 어드레스를 발생시켜 상기 파형 데이터 기억 수단에 기억된 파형 데이터를 판독하는 파형 데이터 판독 수단과, 상기 파형 데이터 판독 수단에 의해 상기 파형 데이터 기억 수단으로부터 판독된 파형 데이터에 노이즈를 부여하는 노이즈 부여 수단을 포함하는 것을 특징으로 한다.
바람직하게는, 발음 개시 지시에 연동하여 상승함과 함께 발음 정지 지시에 연동하여 감쇠되는 엔벨로프 신호를 형성하고, 해당 형성한 엔벨로프 신호를 상기 파형 데이터 판독 수단에 의해 상기 파형 데이터 기억 수단으로부터 판독된 파형 데이터, 혹은 상기 노이즈 부여 수단에 의해 노이즈가 부여된 파형 데이터에 부여하는 엔벨로프 부여 수단을 더 포함하는 것을 특징으로 한다.
또한, 상기 포만트 형성부의 출력에 대하여 상기 포만트 레벨에 대응한 레벨 데이터를 승산하는 승산 수단을 더 포함하도록 한 것을 특징으로 한다.
또한, 상기 복수개의 포만트 형성부로부터 출력되는 원하는 포만트 중심 주파수 및 원하는 포만트 레벨을 갖는 복수개의 포만트를 합성하는 것에 의해, 무성음이 생성되는 것을 특징으로 한다.
또한, 상기 파형 데이터 기억 수단은 사인 파형 데이터를 기억하고 있는 것을 특징으로 한다.
또한, 상기 노이즈 부여 수단에 의해 부여되는 노이즈는, 백색 잡음을 필터에 의해 대역 제한하도록 한 것을 특징으로 한다.
이러한 본 발명의 제2면에 의하면, 원하는 포만트 중심 주파수 및 원하는 포만트 레벨을 갖는 포만트를 각각 형성하는 복수개의 포만트 형성부에 노이즈 부여 수단을 포함시키도록 하고, 해당 복수개의 포만트 형성부에 의해 형성된 복수개의 포만트를 합성하는 것에 의해 음성을 합성하고 있다. 이와 같이, 음성 합성 장치에서 노이즈 부여 수단에 의해 노이즈를 부여한 포만트로 하는 것에 의해, 고품위의 리얼리티가 있는 음성을 합성할 수 있게 된다.
본 발명의 제3면에 관한 음성 합성 장치는, 유성음 합성 모드 또는 무성음 합성 모드 중 어느 하나를 나타내는 모드 지정에 따라, 원하는 유성음 포만트 또는 원하는 무성음 포만트 중 어느 하나를 형성하는 복수개의 포만트 형성부로 이루어진다. 해당 복수개의 포만트 형성부는 형성한 복수개의 유성음 포만트 또는 복수개의 무성음 포만트를 합성하는 것에 의해 유성음 또는 무성음을 합성한다. 상기 복수개의 포만트 형성부 각각이 소정의 파형 형상에 대응한 파형 데이터를 기억하고 있는 파형 데이터 기억 수단과, 상기 포만트 중심 주파수에 대응한 레이트로 변화하는 어드레스를 발생시켜 상기 파형 데이터 기억 수단에 기억된 파형 데이터를 판독하는 파형 데이터 판독 수단과, 유성음 합성 모드시에는 피치 주기에 대응한 타이밍마다 급속하게 감쇠됨과 함께 감쇠 후에 급속하게 상승하는 형상의 엔벨로프 신호를 생성하고, 무성음 합성 모드시에는 발음 개시 지시에 연동하여 상승함과 함께 발음 종료 지시에 연동하여 감쇠되는 엔벨로프 신호를 생성하여, 해당 생성한 엔벨로프 신호를 상기 파형 데이터 판독 수단에 의해 상기 파형 데이터 기억 수단으로부터 판독된 파형 데이터에 부여하는 엔벨로프 부여 수단을 포함하는 것을 특징으로 한다. 바람직하게는, 무성음 합성 모드시에 상기 파형 데이터 판독 수단에의해 상기 파형 데이터 기억 수단으로부터 판독된 파형 데이터에 노이즈를 부여하는 노이즈 부여 수단이 상기 복수개의 포만트 형성부에 더 구비되는 것을 특징으로 한다.
또한 본 발명의 음성 합성 장치는, 유성음 합성 모드 또는 무성음 합성 모드 중 어느 하나를 나타내는 모드 지정에 따라, 원하는 유성음 포만트 또는 원하는 무성음 포만트 중 어느 하나를 형성하는 복수개의 포만트 형성부로 이루어진다. 해당 복수개의 포만트 형성부는 형성한 복수개의 유성음 포만트 또는 복수개의 무성음 포만트를 합성하는 것에 의해 유성음 또는 무성음을 합성한다. 상기 복수개의 포만트 형성부 각각이 복수 종류의 파형 형상에 대응한 복수개의 파형 데이터를 기억하고 있는 파형 데이터 기억 수단과, 유성음 합성 모드시에는 상기 복수 종류의 파형 형상 중에서 원하는 파형 형상을 지정하는 한편, 무성음 합성 모드시에는 미리 정해진 소정의 파형 형상을 지정하는 파형 형상 지정 수단과, 포만트 중심 주파수에 대응한 레이트로 변화하는 어드레스를 발생시켜, 상기 파형 형상 지정 수단에 의해 지정된 파형 형상에 대응한 파형 데이터를 상기 파형 데이터 기억 수단으로부터 판독하는 파형 데이터 판독 수단과, 유성음 합성 모드시에는 피치 주기에 대응한 타이밍마다 급속하게 감쇠됨과 함께 감쇠 후에 급속하게 상승하는 형상의 엔벨로프 신호를 생성하고, 무성음 합성 모드시에는 발음 개시 지시에 연동하여 상승함과 함께 발음 종료 지시에 연동하여 감쇠되는 엔벨로프 신호를 생성하여, 해당 생성한 엔벨로프 신호를 상기 파형 데이터 판독 수단에 의해 상기 파형 데이터 기억 수단으로부터 판독된 파형 데이터에 부여하는 엔벨로프 부여 수단을 포함하는 것을특징으로 한다. 바람직하게는, 무성음 합성 모드시에 상기 파형 데이터 판독 수단에 의해 상기 파형 데이터 기억 수단으로부터 판독된 파형 데이터에 노이즈를 부여하는 노이즈 부여 수단이, 상기 복수개의 포만트 형성부에 더 포함되어 있는 것을 특징으로 한다.
이러한 본 발명의 제3면에 의하면, 복수개의 포만트 형성부에 의해 원하는 유성음 포만트 또는 원하는 무성음 포만트를 형성하고, 형성된 복수개의 유성음 포만트 또는 복수개의 무성음 포만트를 합성하는 것에 의해 유성음 또는 무성음을 합성하고 있다. 그리고, 유성음 포만트를 형성하는 파형 데이터에 피치 주기의 엔벨로프 신호를 부여하도록 하고 있다. 이에 의해, 유성음 포만트에 피치감을 갖게 할 수 있으며, 고품위의 리얼리티가 있는 음성을 합성할 수 있게 된다. 또, 무성음 포만트를 형성하는 상기 파형 데이터에 노이즈를 부여하는 것에 의해, 보다 고품위의 리얼리티가 있는 음성을 합성할 수 있게 된다.
본 발명의 제4면에서는, 원하는 포만트 중심 주파수 및 원하는 포만트 레벨을 갖는 포만트를 각각 형성하는 복수개의 포만트 형성부를 구비하고, 해당 복수개의 포만트 형성부에 의해 형성된 복수개의 포만트를 합성하는 것에 의해 음성을 합성하는 음성 합성 장치에서, 상기 복수개의 포만트 형성부 각각이 복수 종류의 파형 형상 중에서 원하는 파형 형상을 지정하는 파형 형상 지정 수단과, 상기 복수 종류의 파형 형상에 대응한 복수개의 파형 데이터를 기억하는 파형 데이터 기억 수단과, 상기 포만트 중심 주파수에 대응한 레이트로 변화하는 어드레스를 발생시켜, 상기 파형 형상 지정 수단에 의해 지정된 파형 형상에 대응한 파형 데이터를 상기파형 데이터 기억 수단으로부터 판독하는 파형 데이터 판독 수단과, 상기 피치 주기에 대응한 타이밍마다 급속하게 감쇠됨과 함께 감쇠 후에 급속하게 상승하는 형상의 엔벨로프 신호를 형성하고, 해당 형성한 엔벨로프 신호를 상기 파형 데이터 판독 수단에 의해 상기 파형 데이터 기억 수단으로부터 판독된 파형 데이터에 부여하는 엔벨로프 부여 수단을 포함하는 것을 특징으로 한다.
바람직하게는, 상기 복수개의 포만트 형성부에 의해 형성된 복수개의 포만트를 합성하는 것에 의해 유성음이 합성되는 것을 특징으로 한다.
이러한 본 발명의 제4 면에 의하면, 복수개의 포만트 형성부에 의해 원하는 포만트 중심 주파수 및 원하는 포만트 레벨을 각각 갖는 포만트를 형성하고, 형성된 복수개의 포만트를 합성하는 것에 의해 음성을 합성하고 있다. 그리고, 포만트를 형성하는 파형 데이터에 피치 주기의 엔벨로프 신호를 부여하게 하고 있다. 이에 의해, 포만트에 피치감을 갖게 할 수 있으며, 고품위의 리얼리티가 있는 음성을 합성 할 수 있게 된다. 또, 유성음 포만트를 형성하는 파형 데이터에 피치 주기의 엔벨로프 신호를 부여하는 것에 의해, 유성음 포만트에 피치감을 갖게 할 수 있다.
본 발명의 실시예의 음원 장치와 겸용되는 음성 합성 장치의 구성을 나타내는 블록도를 도 1에 도시한다.
도 1에 도시하는 음성 합성 장치(1)는 복수 종류의 파형 형상의 파형 데이터를 기억하고 있는 파형 데이터 기억부와, 이 파형 데이터 기억부로부터 소정의 파형 데이터를 판독하는 판독 수단을 적어도 구비하는 9개의 파형 테이블 보이스(WT 보이스)부(10a, 10b, 10c, 10d, 10e, 10f, 10g, 10h, 10i)와, WT보이스부(10a∼10i)로부터 출력되는 파형 데이터를 믹싱하는 믹싱 수단(11)으로 구성되고, 믹싱 수단(11)으로부터는 발생된 악음 혹은 합성된 음성이 출력된다. 이 경우, WT 보이스부(10a∼10i)에 각종 파라미터로서 악음 파라미터 및 음성 파라미터가 공급되어 있고, 악음/음성의 발생 지시를 내리는 음성 모드 플래그(HVMODE)가 악음의 발생을 지시(HVMODE=0)한 경우에는 악음 파라미터가 선택되어 WT 보이스부(10a∼10i)에서 사용된다. 그리고, 선택된 악음 파라미터에 기초하여 WT 보이스부(10a∼10i)로부터 발생된 복수개의 악음의 파형 데이터가 출력되고, 믹싱 수단(11)으로부터 최대 9음으로 이루어지는 악음이 출력된다.
그리고, 악음/음성의 발생 지시를 내리는 음성 모드 플래그(HVMODE)가 음성의 발생을 지시(HVMODE=1)한 경우에는, 음성 파라미터가 선택되어 WT 보이스부(10a∼10i)에서 사용된다. 그리고, 선택된 음성 파라미터에 기초하여 WT 보이스부(10a∼10i)로부터 유성음 피치 신호, 유성음 포만트 혹은 무성음 포만트를 형성하는 파형 데이터가 출력되고, 유성음 포만트 및 무성음 포만트를 형성하고 있는 파형 데이터가 믹싱 수단(11)으로 합성되는 것에 의해 1개의 음성이 출력된다. HVMODE의 HV는 Human Voice의 약어이다. 또한, U/V는 무성음(Unvoiced Sound)/유성음(Voiced Sound) 지시 플래그이고, HVMODE=1 및 U/V=0이 공급되어 있는 경우에는, WT 보이스부(10b∼10i)로부터 유성음의 포만트를 형성하는 파형 데이터가 출력된다. 또한, HVMODE=1 및 U/V=0이 공급되어 있는 WT 보이스부(10a)로부터는 유성음의 피치 주기로 되는 유성음 피치 신호가 출력되고, 파형 데이터는 이용되지 않는다. WT 보이스부(10a)로부터 출력된 유성음 피치 신호는 WT보이스부(10b∼10i)로 공급되어, 유성음 포만트를 형성하는 파형 데이터의 위상이 유성음 피치 신호의 주기마다 리세트된다. 또한, 유성음 포만트의 엔벨로프 형상이 유성음 피치 신호의 주기에 대응한 것으로 된다. 이에 의해, 유성음 포만트에 피치감을 갖게 할 수 있다.
그리고, WT 보이스부(10b∼10i)에 HVMODE=1 및 U/V=1이 공급되어 있는 경우에는, WT 보이스부(10b∼10i)로부터 무성음의 포만트를 형성하는 파형 데이터가 출력된다. 또한, HVMODE=1 및 U/V=1이 공급되어 있는 WT 보이스부(10a)로부터의 출력은 이용되지 않는다. 이와 같이, HVMODE=1로 하면, WT 보이스부(10b∼10i)에 의해 유성음 포만트 혹은 무성음 포만트의 포만트를 최대 8 포만트 출력할 수 있다.
여기서, 음성에 대하여 설명하면, 음성의 원천이 되는 것은 성대의 진동이지만, 성대의 진동은 발음하는 말이 틀려도 거의 변화하지는 않는다. 입을 여는 방법이나 목구멍의 형태 등에 의해 발생하는 공진이나 공명, 그리고 그것에 부수하는 마찰음이나 파열음 등이 성대의 진동에 추가됨으로써 다양한 음성으로 되어 있다. 이러한 음성에는, 특정한 주파수 영역에 스펙트럼이 집중되어 있는 포만트라고 하는 부분이 주파수축 상에서 복수개소 존재하고 있다. 이 포만트의 중앙 주파수, 혹은 진폭 최대의 주파수가 포만트 중심 주파수이다. 음성에 포함되는 포만트의 수나, 각 포만트의 중심 주파수나 진폭, 대역 폭 등은 음성의 성질을 정하는 요소로서, 음성을 내는 사람의 성별이나 체격, 연령 등에 의해 크게 달라지게 된다. 또한, 음성으로는 발음하는 말의 종류마다 특징적인 포만트의 조합이 정해져 있으며, 포만트의 조합은 음질과는 무방하다. 포만트의 종류를 크게 나누면, 유성음을합성하기 위한 피치감을 갖는 유성음 포만트와, 무성음을 합성하기 위한 피치감을 갖지 않는 무성음 포만트로 이루어진다. 또, 유성음이란, 발음할 때에 성대가 진동하는 음성으로서, 유성음에는 모음과 반모음, 그리고 バ행, ガ행, マ행, ラ행 등에서 사용되는 유성 자음이 포함된다. 또한, 무성음이란, 발음할 때에 성대가 진동하지 않는 음성으로서, ハ행, カ행, サ행 등의 자음이 무성음에 해당한다.
도 1에 도시하는 구성의 본 발명에 따른 음원 장치와 겸용되는 음성 합성 장치(1)에 있어서, 악음을 발생시킬 때에는 HVMODE=0으로서 WT 보이스부(10a∼10i) 각각에 복수개의 악음을 발생하도록 하고 있다. 즉, 최대 9음으로 이루어지는 악음을 발생시킬 수 있다.
음성을 합성할 때에는, HVMODE=1로서 합성하는 유성음 혹은 무성음의 음성에 대응하는 유성음 포만트 혹은 무성음 포만트를 WT 보이스부(10b∼10i)에 의해 형성하도록 하고 있다. 이 경우, 합성되는 음성은 최대 8개의 포만트가 조합된다. 예를 들면, 합성되는 음성이 유성음인 경우에는 WT 보이스부(10b∼10i)에 U/V=0이 공급되고, 공급되고 있는 음성 파라미터에 기초한 유성음 포만트가 각각 WT 보이스부(10b∼10i)에 의해 형성된다. 이 때에, WT 보이스부(10a)에는 U/V=0이 공급되고, WT 보이스부(10a)는 공급되고 있는 음성 파라미터에 기초하여 유성음 피치 신호를 발생시킨다. 이 유성음 피치 신호는 WT 보이스부(10b∼10i)에 공급되어, 출력되는 유성음 포만트를 형성하는 파형 데이터의 위상이 유성음 피치 신호의 주기마다 리세트된다. 또한, 유성음 포만트의 엔벨로프 형상이 유성음 피치 신호의 주기에 대응하게 된다. 이에 의해 피치감을 갖는 유성음 포만트가 WT보이스부(10b∼10i)에 의해 형성된다.
또한, 합성되는 음성이 무성음인 경우에는 WT 보이스부(10b∼10i)에 HVMODE=1 및 U/V=1이 공급되고, 공급되고 있는 음성 파라미터에 기초한 무성음 포만트가 각각 WT 보이스부(10b∼10i)에 의해 형성된다. 후술하는 바와 같이, 무성음의 경우에는 노이즈가 부여된 무성음 포만트로 된다. 이에 의해, 고품질의 리얼리티가 있는 음성을 합성할 수 있다. 또, 무성음을 합성하는 경우에는 WT 음성(10a)의 출력은 이용되지 않는다.
음성 합성 장치(1)에서의 WT 보이스부(10a∼10i)의 구성은 동일한 구성으로 되어 있고, WT 보이스부(10)로서 이하에 그 구성을 설명한다. 도 2는 WT 보이스부(10)의 개략 구성을 도시하는 블록도이다. 또, 도 2 이후에, (WT), (유성음 포만트), (무성음 포만트)의 표기는, 그 파라미터가 각각 악음, 유성음 포만트, 무성음 포만트를 생성하기 위한 파라미터인 것을 나타내고 있다.
도 2에서, 위상 데이터 발생기(PG : Phase Generator : 20)는 발생시켜야 할 악음의 피치 혹은 유성음 피치 신호, 유성음 포만트 중심 주파수, 무성음 포만트 중심 주파수 중 어느 하나에 대응하는 위상 데이터를 발생시키고 있다. PG(20)에는 음성 모드 플래그(HVMODE), 무성음/유성음 지시 플래그(U/V)의 플래그 정보와, 악음 파라미터로서 악음의 옥타브 정보 BLOCK(WT), 악음의 주파수 정보 FNUM(WT)가 공급되고 있다. 또한, 음성 파라미터로서 유성음 피치 신호의 옥타브 정보 BLOCK(유성음 피치), 유성음 피치 신호의 주파수 정보 FNUM(유성음 피치), 혹은 유성음 포만트의 옥타브 정보 BLOCK(유성음 포만트), 유성음 포만트의 주파수 정보 FNUM(유성음 포만트), 무성음 포만트의 옥타브 정보 BLOCK(무성음 포만트), 무성음 포만트의 주파수 정보 FNUM(무성음 포만트)의 각 파라미터가 공급되고 있다. PG(20)에서는, 공급되고 있는 각종 파라미터가 플래그 정보에 의해 선택되고, 선택한 파라미터에 기초하여 발생되어야 할 악음의 음정 혹은 유성음 피치 신호, 유성음 포만트 중심 주파수, 무성음 포만트 중심 주파수 중 어느 하나에 대응하는 위상 데이터가 발생되고 있다.
PG(20)의 상세 구성을 도 3에 도시한다. 도 3에서 셀렉터(30)에서는 U/V 플래그의 상태에 따라 유성음 피치 신호 혹은 유성음 포만트의 주파수 정보 FNUM과, 무성음 포만트의 주파수 정보 FNUM 중 어느 하나가 선택되어 셀렉터(31)에 출력된다. 셀렉터(31)에서는 HVMODE 플래그의 상태에 따라 악음의 주파수 정보 FNUM(WT)과, 셀렉터(30)로부터 출력되는 음성 관련의 주파수 정보 FNUM 중 어느 하나가 선택되어 시프터(34)에 출력되고, 셀렉터(31)로부터 출력되는 주파수 정보 FNUM이 시프터(34)에 세트된다. 또한, 셀렉터(32)에서는 U/V 플래그의 상태에 따라 유성음 피치 신호 혹은 유성음 포만트의 옥타브 정보 BLOCK과, 무성음 포만트의 옥타브 정보 BLOCK 중 어느 하나가 선택되어 셀렉터(33)에 출력된다. 셀렉터(33)에서는 HVMODE 플래그의 상태에 따라 악음의 옥타브 정보 BLOCK(WT)과, 셀렉터(32)로부터 출력되는 음성 관련 옥타브 정보 BLOCK 중 어느 하나가 선택되어 시프터(34)에 시프트 정보로서 출력되고, 시프터(34)에 세트되어 있는 주파수 정보 FNUM은 옥타브 정보 BLOCK에 응하여 시프트된다. 이에 의해, 발생해야 할 악음의 음정, 유성음 피치 신호, 유성음 포만트의 중심 주파수, 무성음 포만트의 중심 주파수 중 어느하나를 발생시키기 위한 옥타브가 가미된 위상 데이터가 PG 출력으로서 PG(20)로부터 출력된다.
도 2로 되돌아가 PG(20)로부터의 PG 출력은 어드레스 발생기(ADG : Address Generator : 21)에 입력되고, PG 출력으로 되는 위상 데이터를 누산하는 것에 의해, 파형 데이터 기억부(WAVE TABLE : 22)로부터 원하는 파형 형상의 파형 데이터를 판독하기 위한 판독 어드레스를 발생시키고 있다. ADG(21)에는 음성 모드 플래그(HVMODE), 무성음/유성음 지시 플래그(U/V)의 플래그 정보와, 악음 파라미터로서 스타트 어드레스 SA(WT), 루프 포인트 LP(WT), 엔드 포인트 EP(WT)가 공급되고, 또한 음성 파라미터로서, 유성음 포만트를 형성하기에 적합한 파형을 선택하기 위한 파형 선택(WS) 신호와, 악음 및 음성에 공통된 발음 개시를 지시하는 키 온(KcyOn) 신호가 공급되고 있다.
악음을 발생시키는 경우에는, HVMODE=0으로서 키 온 신호의 개시 타이밍에서 스타트 어드레스 SA(WT)가 ADG(21)로부터 출력되고, 스타트 어드레스 SA(WT)로 나타내는 파형 데이터 기억부(22)의 위치로부터 파형 데이터의 판독이 개시된다. 그리고, PG(20)로부터의 위상 데이터를 누산해 가는 것에 의해 엔드 포인트 EP(WT)까지의 판독 어드레스가 악음의 음정에 응한 레이트로 변화하도록 ADG(21)로부터 순차적으로 출력된다. 이에 의해, 엔드 포인트 EP(WT)로 나타내는 파형 데이터 기억부(22)의 위치까지의 파형 데이터의 샘플이 악음의 음정에 응한 레이트로 순차적으로 판독된다. 이어서, 루프 포인트 LP(WT)에 상당하는 판독 어드레스가 ADG(21)로부터 출력되고, 또한 PG(20)로부터의 위상 데이터를 누산해 가는 것에 의해 엔드포인트 EP(WT)까지의 판독 어드레스가 악음의 음정에 응한 레이트로 변화하면서 ADG(21)로부터 순차적으로 출력된다. 이에 의해, 루프 포인트 LP(WT)로 나타내는 파형 데이터 기억부(22)의 위치로부터 엔드 포인트 EP(WT)로 나타내는 파형 데이터 기억부(22)의 위치까지의 파형 데이터의 샘플이 악음의 음정에 응한 레이트로 순차적으로 판독된다. 루프 포인트 LP(WT)로부터 엔드 포인트 EP(WT)까지의 판독 어드레스는 키 온 신호에 의해 발음 정지될 때까지 반복하여 발생된다. 이에 의해, 키 온 신호로 나타내는 발음 개시로부터 발음 정지까지의 원하는 파형 데이터를 악음의 음정에 응한 레이트로 파형 데이터 기억부(22)로부터 판독할 수 있다.
또한, 음성을 합성할 때에는 HVMODE=1로서 키 온 신호의 개시 타이밍에서 WS(유성음 포만트) 신호로 나타내는 스타트 어드레스, 혹은 미리 정해져 있는 무성음 포만트용의 스타트 어드레스에서 나타내는 파형 데이터 기억부(22)의 위치로부터 파형 데이터의 판독이 개시된다. 그리고, PG(20)로부터의 위상 데이터를 누산해 가는 것에 의해 고정으로 되어 있는 어드레스 범위의 판독 어드레스가 유성음 포만트 혹은 무성음 포만트의 중심 주파수에 응한 레이트로 변화하도록 ADG(21)로부터 순차적으로 출력된다. 이에 의해, 파형 데이터의 샘플이 파형 데이터 기억부(22)로부터 유성음 포만트 혹은 무성음 포만트의 중심 주파수에 응한 레이트로 순차적으로 판독된다. 또, WT 보이스부(10a)에서는 PG(20)로부터의 위상 데이터를 누산한 누산값이 유성음 피치 주기로 미리 정해져 있는 소정의 값(상수값)에 도달하게 되고, 상수값에 도달했을 때에 유성음 피치 신호(펄스 신호)가 출력된다.
이러한 ADG(21)의 상세 구성을 도 4에 도시한다. 도 4에서 PG(20)로부터의위상 데이터는 누산기(ACC : Accumulator : 41)에 입력되어, 클럭마다 누산되는 것에 의해 판독 어드레스의 증가분값이 생성된다. 이 판독 어드레스의 증가분값은 셀렉터(46)를 통하여 가산기(47)에 공급되어 가산기(47)에서 스타트 어드레스가 가산되어 판독 어드레스가 생성되고, ADG 출력으로서 ADG(21)로부터 출력된다.
ADG(21)에서, HVMODE=0으로 되어 악음을 발생시킬 때의 동작을 설명한다. HVMODE=0으로 되면, AND 게이트 AND가 닫히기 때문에 OR 게이트 OR로부터 출력되는 키 온 신호(KeyOn)에 의해서만 누산기(41)는 초기값으로 리세트되고, PG(20)로부터 공급되는 발생되어야 할 악음의 음정에 응한 위상 데이터의 누산을 개시한다. 이 누산은 클럭마다 행해지며, 그 누산값 b는 셀렉터(46) 및 감산기(43)에 출력된다.
감산기(43)에 데이터 a를 공급하는 셀렉터(42)는 HVMODE=0으로 되어 있기 때문에 엔드 포인트 EP(WT)를 데이터 a로서 선택하여 감산기(43)로 출력한다. 이에 의해, 감산기(43)에 의해 연산된 감산값(a-b)이 출력되고, 감산값(a-b)의 MSB가 제외된 진폭값|a-b|이 가산기(45)로 공급된다. 또한, 감산값(a-b)이 마이너스로 되었을 때에 "1"로 되는 MSB(Most Significant Bit) 신호가 선택 신호로서 셀렉터(46)로 공급됨과 함께, 누산기(41)에 로드 신호로서 공급된다. MSB 신호는, 감산값(a-b)이 마이너스가 되었을 때에 "1"이 되기 때문에, 셀렉터(46)는 누산값 b가 엔드 포인트 EP(WT)를 초과할 때까지는 누산값 b를 가산기(47)에 출력한다. 가산기(47)에 가산 데이터를 공급하는 셀렉터(50)는, HVMODE=0으로 되어 있기 때문에 스타트 어드레스 SA(WT)를 선택하여 가산기(47)에 출력한다. 이에 의해, 스타트 어드레스 SA(WT)가 가산된 누산값 b가 ADG 출력으로서 출력된다. 누산값 b는 클럭마다 위상 데이터가 누산되어, 위상 데이터의 레이트로 변화하기 때문에, ADG 출력인 판독 어드레스도 위상 데이터에 응하여 변화해 가게 된다.
그리고, 누산값 b가 엔드 포인트 EP(WT)를 초과했을 때에 MSB 신호는 "1"로 변화하기 때문에, 셀렉터(46)는 가산기(45)로부터 출력되는 데이터 c를 출력하게 된다. 데이터 c는, HVMODE=0으로 되어 있기 때문에 셀렉터(44)에서 선택된 루프 포인트 LP(WT)에, 가산기(45)에서 감산값(a-b)의 MSB가 제외된 진폭값|a-b|이 가산된 연산값으로 된다. 이에 의해, 가산기(47)로부터 출력되는 ADG 출력은 진폭값|a-b|으로 보정된 루프 포인트 LP(WT)의 판독 어드레스로 된다. 또한, MSB 신호가 "1"로 변화하기 때문에 누산기(41)에 로드 신호가 공급되어, 누산기(41)에 데이터 c가 로드된다. 그 결과, MSB 신호가 "0"으로 되돌아가기 때문에 누산기(41)로부터 출력되는 데이터 b가 셀렉터(46)로부터 출력된다. 그리고, 누산기(41)로부터는 클럭마다 위상 데이터가 데이터 c에 가산된 누산값 b가 출력되기 때문에, ADG 출력은 거의 루프 포인트 LP(WT)의 판독 어드레스로부터 위상 데이터에 응한 레이트로 변화해 가게 된다.
이 경우의 ADG 출력을 그래프로 도시하고 설명하면, ADG 출력은 도 5에 도시한 바와 같다. 즉, 키 온 신호가 인가되면 스타트 어드레스 SA(WT)가 출력되고, 위상 데이터에 응한 레이트로 변화하면서 판독 어드레스가 상승해 가, 스타트 어드레스 SA(WT)로부터 엔드 포인트(EP)만큼 증가되었을 때에, 스타트 어드레스 SA(WT)에 루프 포인트(LP)를 가산한 값으로 되돌아가고, 이후에는 스타트 어드레스 SA(WT)에 루프 포인트(LP)를 가산한 값으로부터 엔드 포인트(EP)만큼 증가되기까지의 판독 어드레스를 반복하여 발생하게 된다. 이 때의 판독 어드레스의 변화는, 위상 데이터에 응한 레이트로 된다. 그리고, 키 온 신호에 의해 발음 정지되었을 때에 ADG 출력은 정지된다. 이 ADG 출력인 판독 어드레스에 의해 파형 데이터 기억부(22)로부터 판독된 파형 데이터는, 위상 데이터에 응한 주파수로 된다. 또, 스타트 어드레스 SA(WT)에 의해 파형 데이터 기억부(22)로부터 판독되는 파형 데이터의 종류를 선택 할 수 있기 때문에, 예를 들면 WT 보이스부(10a∼10i)마다 스타트 어드레스 SA(WT)를 선택하는 것에 의해, WT 보이스부(10a∼10i) 마다의 음색을 서로 다르게 할 수 있게 된다.
이어서, ADG(21)가 WT 보이스부(10a)의 어드레스 발생기이고, HVMODE=1 및 U/V=0으로 되어 유성음 피치 신호를 발생할 때의 동작을 설명한다. HVMODE=1 및 U/V=0으로 되면, AND 게이트 AND가 열리지만, WT 음성(10a)에는 유성음 피치 신호가 공급되고 있지 않기 때문에, OR 게이트 OR로부터는 키 온 신호만이 출력된다. 따라서, 누산기(41)는 키 온 신호에 의해 초기값으로 리세트되며, PG(20)로부터 공급되는 발생되어야 할 유성음 피치 신호에 응한 위상 데이터의 누산을 개시한다. 이 누산은 클럭마다 행해지며, 그 누산값 b는 셀렉터(46) 및 감산기(43)에 출력된다. 감산기(43)에 데이터 a를 공급하는 셀렉터(42)는 HVMODE=1로 되어 있기 때문에 미리 정해져 있는 상수값을 데이터 a로서 선택하여 감산기(43)에 출력한다. 이에 의해, 감산기(43)로 연산된 감산값(a-b)이 출력되고, 감산값(a-b)의 MSB가 제외된 진폭값|a-b|이 가산기(45)로 공급된다.
또한, 감산값(a-b)의 MSB 신호가 선택 신호로서 셀렉터(46)에 공급됨과 함께, 누산기(41)에 로드 신호로서 공급된다. MSB 신호는 감산값(a-b)이 마이너스의 값이 되었을 때, 즉 누산값이 상수값에 달했을 때에 "1"이 되고, 누산기(41)에 로드 신호로서 공급되어, 누산기(41)에 데이터 c가 로드된다. 데이터 c는 HVMODE=1로 되어 있기 때문에 셀렉터(44)에서 선택된 "0"에, 가산기(45)에서 감산값(a-b)의 MSB가 제외된 진폭값|a-b|이 가산된 연산값으로 된다. 누산기(41)가 다음 클럭에 데이터 c에 위상 데이터를 가산하면, MSB 신호는 "0"이 된다. 이와 같이 하여, MSB 신호는 PG(20)로부터 공급된 유성음 피치 파라미터에 기초한 위상 데이터에 응한 주기, 즉 유성음 피치의 주기로 발생된다. 따라서, HVMODE=1 및 U/V=0이 공급된 WT 보이스부(10a)에서는 이 MSB 신호를 유성음 피치 신호로서 출력하고 있다. 유성음 피치 신호를 그래프로 도시하면 도 7에 도시한 바와 같이 유성음 피치의 주기를 갖는 펄스 신호로 된다. 이 경우에, WT 보이스부(10a)로부터는 ADG 출력도 출력되지만, 이 ADG 출력은 판독 어드레스로서 사용하지 않는다.
이어서, ADG(21)에서, HVMODE=1 및 U/V=0으로 되어 유성음 포만트를 발생할 때의 동작을 설명한다. HVMODE=1 및 U/V=0으로 되면, 게이트 NOT의 작용에 의해 AND 게이트 AND가 개방되기 때문에 OR 게이트 OR로부터 출력되는 유성음 피치 신호 및 키 온 신호에 의해 누산기(41)는 초기값으로 리세트되고, PG(20)로부터 공급되는 발생되어야 할 유성음 포만트의 중심 주파수에 응한 위상 데이터의 누산을 개시한다. AND 게이트 AND에는, WT 보이스부(10a)로부터 출력되는 도 7에 도시하는 유성음 피치 신호가 공급되고 있다. 누산기(41)의 누산은 클럭마다 행해지며, 그 누산값 b는 셀렉터(46) 및 감산기(43)로 출력된다. 감산기(43)에 데이터 a를 공급하는 셀렉터(42)는 HVMODE=1로 되어 있기 때문에, 미리 정해져 있는 상수값을 데이터 a로서 선택하여 감산기(43)에 출력한다. 상수값으로 하는 것은 포만트를 형성하는 파형 데이터의 데이터량이 고정값으로 되어 있기 때문이다. 그리고, 감산기(43)에 의해 연산된 감산값(a-b)이 출력되고, 감산값(a-b)의 MSB가 제외된 진폭값|a-b|이 가산기(45)로 공급된다.
또한, 감산값(a-b)의 MSB 신호가 선택 신호로서 셀렉터(46)로 공급됨과 함께, 누산기(41)에 로드 신호로서 공급된다. MSB 신호는, 감산값(a-b)이 마이너스의 값이 되었을 때에 "1"이 되기 때문에, 셀렉터(46)는 누산값 b가 상수값을 넘을 때까지는 누산값 b를 가산기(47)로 출력한다. 가산기(47)에 가산 데이터를 공급하는 셀렉터(50)는 HVMODE=1로 되어 있기 때문에 셀렉터(49)의 출력을 선택하여 가산기(47)로 출력한다. 또한, 셀렉터(49)는 U/V=0으로 되어 있기 때문에, 스타트 어드레스 발생기(48)로부터 출력되는 유성음 포만트를 형성하는 선택된 파형 데이터의 스타트 어드레스 SA(WS)를 셀렉터(49)로 출력하고 있다. 또한, 스타트 어드레스 발생기(48)는 유성음 포만트를 형성하기에 적합한 파형을 선택하도록 입력되어 있는 파형 선택(WS) 신호에 응하여 파형 데이터를 선택하도록 파형 데이터 기억부(22) 상의 스타트 어드레스 SA를 출력하고 있다. 이에 의해, 가산기(47)에서 스타트 어드레스 SA(WS)에 누산값 b가 가산되어, ADG 출력으로서 출력된다. 누산값 b는 클럭마다 위상 데이터가 누산되어 위상 데이터에 응한 레이트로 변화해 가기 때문에, ADG 출력인 유성음 포만트를 형성하는 파형 데이터를 판독하는 판독 어드레스도 위상 데이터에 응한 레이트로 변화해 가게 된다.
그리고, 누산이 진행되어 누산값이 상수값에 도달하면, 감산값(a-b)이 마이너스의 값으로 되어 MSB 신호가 "1"이 되고, 셀렉터(46)로 공급된다. 그 결과, 셀렉터(46)로부터 데이터 c가 출력되지만, 데이터 c는, HVMODE=1로 되어 있기 때문에 셀렉터(44)에서 선택된 "0"에, 가산기(45)에서 감산값(a-b)의 MSB가 제외된 진폭값|a-b|이 가산된 연산값으로 된다. 이에 의해, 가산기(45)로부터 출력되는 ADG 출력은 진폭값|a-b|의 판독 어드레스로 된다. 또한, MSB 신호는 누산기(41)에 로드 신호로서 공급되어, 누산기(41)에 데이터 c가 로드된다. 그리고, 다음 클럭에서 위상 데이터가 데이터 c에 가산되면, MSB 신호가 "0"으로 되돌아가기 때문에 누산기(41)로부터 출력되는 데이터 b가 셀렉터(46)로부터 출력된다. 누산기(41)에 있어서의 위상 데이터의 누산은, 클럭마다 행해져 ADG 출력은 스타트 어드레스 SA(WS)로부터 위상 데이터에 응한 레이트로 변화해 가고, 상수값만큼 증가했을 때에 다시 스타트 어드레스 SA(WS)로 되돌아가기 때문에, ADG 출력은 스타트 어드레스 SA(WS)로부터 상수값만큼 증가되기까지의 판독 어드레스를 반복하게 된다. 이 경우의 위상 데이터는 유성음 포만트의 중심 주파수에 기초하고 있기 때문에, 판독 어드레스는 유성음 포만트의 중심 주파수에 응한 레이트로 변화하게 된다. 또한, 누산기(41)는 WT 보이스부(10a)로부터 출력되는 유성음 피치 신호에 의해 초기값으로 리세트되기 때문에, ADG 출력은 유성음 피치의 주기마다 리세트되고, ADG 신호를 판독 어드레스로서 파형 데이터 기억부(22)로부터 판독한 파형 데이터에 의해 형성되는 소정의 중심 주파수를 갖는 유성음 포만트에 피치감을 갖게 할 수 있게 된다.
이 경우의 ADG 출력을 그래프로 나타내면, 도 6에 도시한 바와 같다. 즉, 키 온 신호가 인가되면 유성음 포만트를 형성시키는 파형 데이터를 선택하는 WS 신호에 대응한 스타트 어드레스 SA(WS)가 출력된다. 그리고, 누산기(41)의 작용에 의해 유성음 포만트의 중심 주파수에 응한 레이트로 변화하는 판독 어드레스가 상승하여 스타트 어드레스 SA(WS)가 상수값만큼 증가되었을 때에, 스타트 어드레스 SA(WS)로 되돌아가고, 이후에는 스타트 어드레스 SA(WS)로부터 상수값만큼 증가한 값까지의 판독 어드레스를 반복하여 발생하게 된다. 이 ADG 출력에 의해, 파형 데이터 기억부(22)로부터 선택된 파형 데이터를 판독하면, 판독된 파형 데이터에 의해 소정의 중심 주파수의 유성음 포만트가 형성된다. 그리고, 키 온 신호에 의해 발음 정지되었을 때에 ADG 출력은 정지된다. 또, 스타트 어드레스 SA(WS), 즉 WS(유성음 포만트) 신호에 의해 파형 데이터 기억부(22)로부터 판독되는 파형 데이터의 종류를 선택할 수 있으며, 이에 의해 형성되는 유성음 포만트의 포만트를 변화시킬 수 있다. 또한, 도 6에서는, 누산기(41)가 WT 보이스부(10a)로부터 출력되는 유성음 피치 신호에 의해 초기값으로 리세트되는 것은 도시하지 않는다.
이어서, ADG(21)에서, HVMODE=1 및 U/V=1로 되어 무성음 포만트를 발생시킬 때의 동작을 설명한다. HVMODE=1 및 U/V=1로 되면, AND 게이트 AND가 게이트 NOT의 작용에 의해 닫히기 때문에 OR 게이트 OR로부터 출력되는 키 온 신호에 의해서만 누산기(41)는 초기값으로 리세트되어, PG(20)로부터 공급되는 발생되어야 할 무성음 포만트의 중심 주파수에 응한 위상 데이터의 누산을 개시한다. 이 누산은 클럭마다 행해져, 그 누산값 b는 셀렉터(46) 및 감산기(43)로 출력된다. 감산기(43)에 데이터 a를 공급하는 셀렉터(42)는 HVMODE=1로 되어 있기 때문에 미리 정해져 있는 상수값을 데이터 a로서 선택하여 감산기(43)로 출력한다. 상수값으로 하는 것은 포만트를 형성하는 파형 데이터의 데이터량이 고정값으로 되어 있기 때문이다. 그리고, 감산기(43)에 의해 연산된 감산값(a-b)이 출력되고, 감산값(a-b)의 MSB가 제외된 진폭값|a-b|이 가산기(45)로 공급된다.
또한, 감산값(a-b)의 MSB 신호가 선택 신호로서 셀렉터(46)로 공급됨과 함께, 누산기(41)에 로드 신호로서 공급된다. MSB 신호는 감산값(a-b)이 마이너스의 값이 되었을 때에 "1"이 되기 때문에, 셀렉터(46)는 누산값 b가 상수값을 초과할 때까지는 누산값 b를 가산기(47)로 출력한다. 가산기(47)에 가산 데이터를 공급하는 셀렉터(50)는 HVMODE=1로 되어 있기 때문에 셀렉터(49)의 출력을 선택하여 가산기(47)로 출력한다. 또한, 셀렉터(49)는 U/V=1로 되어 있기 때문에, 미리 지정(고정)된 사인파의 파형 데이터의 스타트 어드레스 SA(사인)를 셀렉터(49)로 출력하고 있다. 이것은, 사인파가 무성음 포만트를 형성하는데 적합하기 때문이다. 이에 의해, 가산기(47)에서 스타트 어드레스 SA(사인)에 누산값 b가 가산되어, ADG 출력으로서 출력된다. 누산값 b는 클럭마다 위상 데이터가 누산되어 무성음 포만트의 중심 주파수에 응한 레이트로 변화해 가기 때문에, ADG 출력인 무성음 포만트를 형성하는 파형 데이터를 판독하는 판독 어드레스도 무성음 포만트의 중심 주파수에 응한 레이트로 변화해 가게 된다.
그리고, 누산값 b가 상수값을 초과했을 때에 MSB 신호는 "1"로 변화하기 때문에, 셀렉터(46)는 가산기(45)로부터 출력되는 데이터 c를 출력하게 된다. 데이터 c는, HVMODE=1로 되어 있기 때문에 셀렉터(44)에서 선택된 "0"에, 가산기(45)에서 감산값(a-b)의 MSB가 제외된 진폭값|a-b|이 가산된 연산값으로 된다. 이에 의해, 가산기(45)로부터 출력되는 ADG 출력은 진폭값|a-b|의 판독 어드레스로 된다. 또한, MSB 신호는 누산기(41)에 로드 신호로서 공급되어, 누산기(41)에 데이터 c가 로드된다. 그리고, 다음 클럭에서 위상 데이터가 데이터 c에 가산되면, MSB 신호가 "0"으로 되돌아가기 때문에 누산기(41)로부터 출력되는 데이터 b가 셀렉터(46)로부터 출력된다. 누산기(41)에서의 위상 데이터의 누산은 클럭마다 행해지며, ADG 출력은 스타트 어드레스 SA(사인)로부터 위상 데이터에 응한 레이트로 변화해 가며, 상수값만큼 증가했을 때에 다시 스타트 어드레스 SA(사인)로 되돌아가기 때문에, ADG 출력은 스타트 어드레스 SA(사인)로부터 상수값만큼 증가되기까지의 판독 어드레스를 반복하게 된다. 이 경우의 위상 데이터는 무성음 포만트의 중심 주파수에 기초하기 때문에, 판독 어드레스는 무성음 포만트의 중심 주파수에 응한 레이트로 변화하게 된다. 이 ADG 신호를 판독 어드레스로서 파형 데이터 기억부(22)로부터 판독한 파형 데이터에 의해, 소정의 중심 주파수를 갖는 무성음 포만트가 형성된다.
이 경우의 ADG 출력을 그래프로 나타내면, 도 8에 도시한 바와 같다. 즉, 키 온 신호가 인가되면 무성음 포만트를 형성시키는 사인파의 파형 데이터의 스타트 어드레스 SA(사인)이 출력되고, 누산기(41)의 작용에 의해 무성음 포만트의 중심 주파수에 응한 레이트로 변화하는 판독 어드레스가 상승하여 스타트 어드레스 SA(사인)이 상수값만큼 증가되었을 때에, 스타트 어드레스 SA(사인)로 되돌아가며,이후에는 스타트 어드레스 SA(사인)로부터 상수값만큼 증가한 값까지의 판독 어드레스를 반복하여 발생하게 된다. 이 ADG 출력에 의해, 파형 데이터 기억부(22)로부터 사인파의 파형 데이터를 판독하면, 판독된 파형 데이터에 의해 소정의 중심 주파수의 무성음 포만트가 형성된다. 그리고, 키 온 신호에 의해 발음 정지되었을 때에 ADG 출력은 정지된다.
여기서, 파형 데이터 기억부(22)에 기억되어 있는 유성음 포만트 혹은 무성음 포만트를 형성하기 위한 복수 종류의 파형 데이터의 파형 형상의 일례를 도 14에 도시한다.
도 14에서는, 파형 데이터 기억부(22)에 32 종류의 파형 형상의 파형 데이터가 기억되어 있는 예가 도시되어 있고, WS(유성음 포만트) 신호로서 "0"을 세트하면, 0번의 사인파가 판독되며, 예를 들면 WS(유성음 포만트) 신호로서 "16"을 세트하면, 16번의 삼각파가 판독된다. 또한, 스타트 어드레스 SA(사인)는 0번의 사인파의 파형 데이터 기억부(22) 상의 스타트 어드레스로 되어 있다. 이들 32 종류의 파형 데이터의 데이터량은 고정으로 되어 있고, 이 데이터량에 상기한 상수값이 대응하고 있다. 따라서, ADG(21)로부터 출력되는 ADG 출력에 의해 32 종류의 파형 데이터 중 어느 하나를 판독하면, 선택된 파형 형상의 파형 데이터가 발음 정지될 때까지 반복하여 판독된다.
도 2로 되돌아가 파형 데이터 기억부(22)로부터 판독된 파형 데이터는 승산기(23)에 공급되고, 엔벨로프 발생기(EG : 24)에 의해 발생된 엔벨로프 신호가 승산된다. EG(24)에는 음성 모드 플래그(HVMODE), 무성음/유성음 지시 플래그(U/V)의 플래그 정보와, 악음 파라미터로서 어택 레이트 AR(WT), 디케이 레이트 DR(WT), 서스테인 레이트 SR(WT), 릴리스 레이트 RR(WT), 서스테인 레이트 SL(WT)이 공급되고, 또한 악음 및 음성에 공통된 발음 개시를 지시하는 키 온(KeyOn) 신호가 공급되고 있다.
이러한 엔벨로프 발생기(EG : 24)의 상세 구성을 나타내는 블록도를 도 9에 도시한다.
악음을 발생시키는 경우에는 도 9에 도시하는 EG(24)에서, HVMODE=0으로서 셀렉터(60)에서 어택 레이트 AR(WT)을 선택하여 셀렉터(61)로 출력하고, 셀렉터(63)에서 디케이 레이트 DR(WT)을 선택하여 셀렉터(61)로 출력하고, 셀렉터(64)에서 릴리스 레이트 RR(WT)을 선택하여 셀렉터(61)로 출력한다. 또한, 셀렉터(61)에는 서스테인 레이트 SR(WT)이 입력되어 있다. 셀렉터(61)는 스테이트 제어부(66)에 의해 제어되어 어택, 디케이, 서스테인, 릴리스의 각 스테이트마다 해당 스테이트의 엔벨로프 파라미터를 선택하여 출력한다. 스테이트 제어부(66)에는, 키 온 신호, 음성 모드 플래그(HVMODE)가 공급됨과 함께, 서스테인 레벨 SL(WT) 신호가 입력되어 있다. 또한, WT 보이스부(10a)로부터 출력되는 유성음 피치 신호, 무성음/유성음 지시 플래그(U/V)도 공급되어 있지만, 이들은 사용되지 않는다. 셀렉터(61)로부터 스테이트에 응하여 출력되는 엔벨로프 파라미터는 누산기(ACC : 65)에 의해 누산되어 엔벨로프가 생성되어 EG 출력으로서 출력됨과 함께, 스테이트 제어부(66)로 공급된다. 스테이트 제어부(66)는 EG 출력의 레벨로부터 스테이트를 판단할 수 있다. 누산기(65)에서는 키 온 신호의 개시 타이밍으로 누산을 개시한다.
이 경우의 EG 출력을 그래프로 도시하면, 도 10에 도시한 바와 같다. 즉, 스테이트 제어부(66) 및 누산기(65)에 공급되어 있는 키 온 신호가 상승하면, 스테이트 제어부(66)는 발음 개시로 판단하여 셀렉터(61)로부터 발음 개시 시의 스테이트인 어택용의 어택 레이트 AR(WT)의 파라미터를 출력시킨다. 이 어택 레이트 AR(WT)의 파라미터는 누산기(65)에서 클럭마다 누산되어 EG 출력은 도 10에 도시하는 AR과 같이 급속하게 상승해 간다. 그리고, EG 출력의 레벨이 예를 들면 0㏈에 도달하면, 스테이트 제어부(66)는 스테이트가 디케이로 이행했다고 판단하여 셀렉터(61)로부터 디케이 레이트 DR(WT)의 파라미터를 출력시킨다. 이 디케이 레이트 DR(WT)의 파라미터는 누산기(65)에 의해 클럭마다 누산되어 EG 출력은 도 10에 도시하는 DR과 같이 급속히 하강해 간다.
EG 출력이 하강하여, EG 출력의 레벨이 서스테인 레벨 SL(WT)에 도달하면, 스테이트 제어부(66)는 그것을 검출하여 스테이트가 서스테인으로 이행했다고 판단하여, 셀렉터(61)로부터 서스테인 레이트 SR(WT)의 파라미터를 출력시킨다. 출력된 서스테인 레이트 SR(WT)의 파라미터는 누산기(65)에서 클럭마다 누산되어 EG 출력은 도 10에 도시하는 SR과 같이 완만한 경사로 하강해 간다. 스테이트 제어부(66)는, 키 온 신호가 하강할 때까지는 서스테인을 유지시키고, 여기서 키 온 신호가 하강하여 스테이트 제어부(66)가 발음 정지라고 판단하면, 셀렉터(64)로부터 릴리스 레이트 RR(WT)의 파라미터를 출력시킨다. 출력된 릴리스 레이트 RR(WT)의 파라미터는 누산기(65)에서 클럭마다 누산되어 EG 출력은 도 10에 도시하는 RR과 같이 급속한 경사로 하강하여 발음이 정지된다.
이어서, 음성에서의 유성음 포만트를 발생시키는 경우에는 도 9에 도시하는 EG(24)에서 HVMODE=1 및 U/V=0으로서 셀렉터(60)에서 초기 스테이트용의 급속 상승 레이트를 선택하여 셀렉터(61)로 출력하고, 셀렉터(62)에서 U/V=0에 응하여 선택된 중간 스테이트용의 상수값을 셀렉터(63)에서 선택하여 셀렉터(61)로 출력하고, 셀렉터(64)에서 종료 스테이트용의 급속 감쇠 레이트를 선택하여 셀렉터(61)로 출력한다. 또한, 셀렉터(61)에는 서스테인 레이트 SR(WT)이 입력되어 있지만, 이 파라미터는 사용되지 않는다. 셀렉터(61)는 스테이트 제어부(66)에 의해 제어되어 초기, 중간, 종료의 각 스테이트마다 해당 스테이트의 엔벨로프 파라미터를 선택하여 출력한다. 스테이트 제어부(66)에는, 키 온 신호, WT 보이스부(10a)로부터 출력되는 유성음 피치 신호, 음성 모드 플래그(HVMODE), 무성음/유성음 지시 플래그(U/V)의 플래그 정보가 공급되어 있다. 또한, 서스테인 레벨 SL(WT) 신호가 공급되고 있지만, 이 경우에는 사용되지 않는다. 셀렉터(61)로부터 스테이트에 응하여 출력되는 엔벨로프 파라미터는 누산기(ACC : 65)에 의해 클럭마다 누산되어 엔벨로프가 생성되어 EG 출력으로서 출력됨과 함께, 스테이트 제어부(66)로 공급된다. 스테이트 제어부(66)는 EG 출력의 레벨로부터 스테이트를 판단할 수 있다. 누산기(65)에서는 키 온 신호의 개시 타이밍으로 누산을 개시한다.
이 경우의 EG 출력을 그래프로 도시하면, 도 11에 도시한 바와 같다. 즉, 스테이트 제어부(66) 및 누산기(65)로 공급되어 있는 키 온 신호가 상승하면, 스테이트 제어부(66)는 발음 개시라고 판단하여 셀렉터(61)로부터 초기 스테이트용의급속 상승 레이트의 파라미터를 출력시킨다. 이 급속 상승 레이트의 파라미터는, 누산기(65)에서 클럭마다 누산되어 EG 출력은 도 11에 도시한 바와 같이 급격히 상승해 간다. 그리고, EG 출력의 레벨이 소정 레벨에 도달하면, 스테이트 제어부(66)는 중간 스테이트로 이행했다고 판단하여 셀렉터(61)로부터 중간 스테이트용의 상수값의 파라미터를 출력시킨다. 이 상수값의 파라미터는, 누산기(65)에 의해 클럭마다 누산되어 EG 출력은 도 11에 도시한 바와 같이 완만하게 하강해 간다.
여기서, 스테이트 제어부(66)에 도 7에 도시한 유성음 피치 신호가 입력되면, 스테이트 제어부(66)는 셀렉터(61)를 제어하여 급속 하강 레이트의 파라미터를 선택하여 누산기(65)에 출력한다. 이 급속 하강 레이트의 파라미터는, 누산기(65)에서 클럭마다 누산되어 EG 출력은 도 11에 도시한 바와 같이 급격히 하강해 간다. 그리고, EG 출력의 레벨이 소정의 최저 레벨에 도달하면, 스테이트 제어부(66)는 셀렉터(61)를 제어하여 급속 하강 레이트의 파라미터를 다시 선택하여 누산기(65)에 출력한다. 이 급속 상승 레이트의 파라미터는, 누산기(65)에서 클럭마다 누산되어 EG 출력은 도 11에 도시한 바와 같이 급격히 상승해 간다. 그리고, EG 출력의 레벨이 소정 레벨에 도달하면, 스테이트 제어부(66)는 중간 스테이트로 이행했다고 판단하여 셀렉터(61)로부터 중간 스테이트용의 상수값의 파라미터를 출력시킨다. 이하, 마찬가지의 동작이 반복되어 행해진다. 이와 같이, 유성음 피치의 주기를 갖는 엔벨로프로 되기 때문에, 이 엠벨로프가 승산기(23)에서 승산된 파형 데이터에 피치감을 공급할 수 있게 된다.
또한, 키 온 신호가 하강하여 스테이트 제어부(66)가 발음 정지로 판단하면, 스테이트 제어부(66)는 셀렉터(61)를 제어하여 급속 하강 레이트의 파라미터를 선택하여 누산기(65)에 출력한다. 이 급속 하강 레이트의 파라미터는 누산기(65)에 의해 클럭마다 누산되어 EG 출력은 급격하게 하강하여 발음이 정지된다.
이어서, 음성에서의 무성음 포만트를 발생시키는 경우에는 도 9에 도시하는 EG(24)에서, HVMODE=1 및 U/V=1로서 셀렉터(60)에서 초기 스테이트용의 급속 상승 레이트를 선택하여 셀렉터(61)로 출력하고, 셀렉터(62)에서 U/V=1에 응하여 선택된 중간 스테이트용의 "0"을 셀렉터(63)에서 선택하여 셀렉터(61)로 출력하고, 셀렉터(64)에서 종료 스테이트용의 급속 감쇠 레이트를 선택하여 셀렉터(61)로 출력한다. 또한, 셀렉터(61)에는 서스테인 레이트 SR(WT)이 입력되고 있지만, 이 파라미터는 사용되지 않는다. 셀렉터(61)는 스테이트 제어부(66)에 의해 제어되어 초기, 중간, 종료의 각 스테이트마다 해당 스테이트의 엔벨로프 파라미터를 선택하여 출력한다. 스테이트 제어부(66)에는 키 온 신호, 음성 모드 플래그(HVMODE), 무성음/유성음 지시 플래그(U/V)의 플래그 정보가 공급되어 있다. 또한, WT 보이스부(10a)로부터 출력되는 유성음 피치 신호 및 서스테인 레벨 SL(WT) 신호가 공급되고 있지만, 이 경우에는 사용되지 않는다. 셀렉터(61)로부터 스테이트에 응하여 출력되는 엔벨로프 파라미터는 누산기(ACC : 65)에 의해 누산되어 엔벨로프가 생성되어 EG 출력으로서 출력됨과 함께, 스테이트 제어부(66)에 공급된다. 스테이트 제어부(66)는 EG 출력의 레벨로부터 스테이트를 판단할 수 있다. 누산기(65)에서는 온 신호의 개시 타이밍으로 누산을 개시한다.
이 경우의 EG 출력을 그래프로 도시하면, 도 12에 도시한 바와 같다. 즉, 스테이트 제어부(66) 및 누산기(65)에 공급되어 있는 키 온 신호가 상승하면, 스테이트 제어부(66)는 발음 개시로 판단하여 셀렉터(61)로부터 초기 스테이트용의 급속 상승 레이트의 파라미터를 출력시킨다. 이 급속 상승 레이트의 파라미터는 누산기(65)에서 클럭마다 누산되어 EG 출력은 도 12에 도시한 바와 같이 급격히 상승해 간다. 그리고, EG 출력의 레벨이 소정 레벨에 도달하면, 스테이트 제어부(66)는 중간 스테이트로 이행했다고 판단하여 셀렉터(61)로부터 중간 스테이트용의 "0"의 파라미터를 출력시킨다. 이에 의해, 누산기(65)로부터 출력되는 EG 출력은 도 12에 도시한 바와 같이, 그 값을 유지하게 된다. 여기서, 키 온 신호가 하강하여 스테이트 제어부(66)가 발음 정지로 판단하면, 스테이트 제어부(66)는 셀렉터(61)를 제어하여 급속 하강 레이트의 파라미터를 선택하여 누산기(65)에 출력한다. 이 급속 하강 레이트의 파라미터는 누산기(65)에서 클럭마다 누산되어 EG 출력은 도 12에 도시한 바와 같이 급격하게 하강하여 발음이 정지된다.
또, 도 10 내지 도 12에 도시하는 EG 출력에서는 직선적으로 변화하고 있는 엔벨로프를 형성하도록 했지만, 곡선적으로 변화하는 엔벨로프를 발생하도록 해도 된다. 또한, EG(24)의 출력을 파형 데이터에 승산하는 승산기(23)는 후술하는 가산기(25)의 후단에 배치해도 된다.
도 2에 되돌아가 승산기(23)에서 엔벨로프가 승산된 파형 데이터는 가산기(25)로 공급되어 노이즈 발생부(26)에 의해 발생된 노이즈와 가산된다. 노이즈는, 예를 들면 백색 잡음이다. 이 경우, 노이즈 발생부(26)에는 음성 모드 플래그(HVMODE), 무성음/유성음 지시 플래그(U/V)의 플래그 정보가 공급되어 있으며, HVMODE=1 및 U/V=1로 되어 무성음 포만트를 발생시킬 때에만 노이즈를 발생하도록 하고 있다. 따라서, 가산기(25)에서는 무성음 포만트를 형성하는 엔벨로프가 승산된 파형 데이터에만 노이즈가 가산되어 출력된다.
여기서, 노이즈 발생부(26)의 상세 구성을 도 13에 도시한다. 도 13에 도시한 바와 같이, 노이즈 발생부(26)에서의 백색 잡음 발생기(70)로부터 발생된 백색 잡음은 4단의 저역 통과 필터(LPF1, LPF2, LPF3, LPF4 : 71, 72, 73, 74)에 의해 대역 제한된다. 그리고, 저역 통과 필터(74)의 출력은 승산기(75)에서 노이즈의 레벨이 조정되어, 셀렉터(76)에 입력된다. 셀렉터(76)는 AND 게이트(AND : 77)의 출력에 의해 선택되어 있고, AND 게이트(77)는 HVMODE=1 및 U/V=1로 되어 무성음 포만트를 발생시킬 때에 셀렉터(76)에서, 승산기(75)로부터 출력되는 노이즈를 출력하고 있다. 또, HVMODE=1 및 U/V=1 중 어느 하나가 "0"으로 되어 악음 혹은 유성음 포만트를 발생시킬 때에는 AND 게이트(77)의 출력에 의해 셀렉터(76)로부터는 노이즈를 대신하여 "0"이 출력된다. 이에 의해, 가산기(25)에서는 무성음 포만트를 형성하는 엔벨로프가 승산된 파형 데이터에만 노이즈가 가산되어 출력된다.
저역 통과 필터(71∼74)는 서로 동일한 구성으로 되어 있고, 대표로서 저역 통과 필터(71)의 구성이 도 13에 도시되어 있다. 저역 통과 필터(71)에서, 백색 잡음 발생기(70)로부터 입력된 백색 잡음은 지연 회로(70a)에 의해 1 샘플 시간 지연되고 계수 승산기(70b)에서 소정의 계수와 승산되어 가산기(70d)로 입력된다. 또한, 입력된 백색 잡음은 계수 승산기(70c)에서 소정의 계수와 승산되어가산기(70d)에 입력되어, 계수 승산기(70b)의 출력에 가산된다. 가산기(70d)의 출력이 저역 통과 필터 출력이 된다. 이러한 구성의, 예를 들면 4단의 저역 통과 필터(71∼74)에 의해 백색 잡음의 대역 제한을 행하는 것에 의해, 음성이 귀에 거슬리게 하는 느낌을 억제할 수 있게 된다. 또, 승산기(75)에서의 노이즈 레벨의 레벨 조정은 반드시 필요한 것은 아니며, 생략하도록 해도 된다.
도 2로 되돌아가 가산기(25)로부터 출력된 파형 데이터는 승산기(27)에 공급되어 출력 레벨이 조정된다. 승산기(27)에는 음성 모드 플래그(HVMODE), 무성음/유성음 지시 플래그(U/V)의 플래그 정보와, 악음의 출력 레벨을 나타내는 레벨(WT), 유성음 포만트의 출력 레벨을 나타내는 레벨(유성음 포만트), 무성음 포만트의 출력 레벨을 나타내는 레벨(무성음 포만트)이 공급되어 있다. 그리고, HVMODE=0으로 되어 악음을 발생하는 경우에는 승산기(27)에서 레벨(WT)이 승산되어 악음의 파형 데이터의 출력 레벨이 조정된다. 또한, HVMODE=1, U/V=0으로 되어 유성음 포만트를 발생하는 경우에는 승산기(27)에서 레벨(유성음 포만트)이 승산되어 유성음 포만트를 형성하는 파형 데이터의 출력 레벨이 조정된다. 이에 의해, 유성음 포만트의 레벨이 소정의 레벨로 된다. 또한, HVMODE=1, U/V=1로 되어 무성음 포만트를 발생하는 경우에는 승산기(27)에서 레벨(무성음 포만트)이 승산되어 무성음 포만트를 형성하는 파형 데이터의 출력 레벨이 조정된다. 이에 의해, 무성음 포만트의 레벨이 소정의 레벨로 된다.
이상의 설명에서는, 본 발명에 따른 음원 장치와 겸용되는 음성 합성 장치는 9개의 파형 데이터 기억부를 갖는 WT 보이스부로 구성했지만, 이것에 한하는 것은아니며 9 미만에서도 9를 초과하는 WT 보이스부로 해도 된다. 9를 초과하는 WT 보이스부로 하면, 악음의 동시 발음 수를 증가시킬 수 있음과 함께, 합성하는 포만트 수를 증가시킬 수 있어 다양한 음성을 합성할 수 있다.
또한, 본 발명에 따른 음원 장치와 겸용되는 음성 합성 장치는, 음성 모드 플래그(HVMODE)로 악음을 지정한 경우에는, 복수개의 WT 보이스부는 악음 형성부로서 기능하고, 음성 모드 플래그(HVMODE)로 음성을 지정한 경우에는 복수개의 WT 보이스부는 포만트 형성부로서 기능하게 된다. 또한, 음성 모드 플래그(HVMODE)를 음성으로 고정하는 것에 의해, 전용의 음성 합성 장치로서 사용할 수 있다.
본 발명의 제1 면은 이상 설명한 바와 같이, 웨이브 테이블 음원 모드시에는 복수개의 악음 형성부에 의해 각각 악음을 발생시킬 수 있으며, 음성 합성 모드시에는 복수개의 악음 형성부에 의해 각각 형성된 복수개의 포만트를 합성하여 음성을 합성할 수 있다. 이와 같이, 복수개의 악음 형성부를 악음 발생과 음성 합성 모두 겸용할 수 있기 때문에, 음원 장치에 음성 합성 장치별로 내장하지 않고 음원 장치에 음성 합성 기능을 갖게 할 수 있게 된다. 또한, 음성 합성 모드시에, 노이즈 부여 수단에 의해 노이즈를 포만트에 부여하는 것에 의해, 고품위의 리얼리티가 있는 음성을 합성할 수 있게 된다.
본 발명의 제2 면은 이상 설명한 바와 같이, 원하는 포만트 중심 주파수 및 원하는 포만트 레벨을 갖는 포만트를 각각 형성하는 파형 테이블 보이스부인 복수개의 포만트 형성부에 노이즈 부여 수단을 포함시키게 하여, 해당 복수개의 포만트형성부에 의해 형성된 복수개의 포만트를 합성하는 것에 의해 음성을 합성하도록 하고 있다. 이와 같이, 음성 합성 장치에서 노이즈 부여 수단에 의해 노이즈를 부여한 포만트로 하는 것에 의해, 고품위의 리얼리티가 있는 음성을 합성할 수 있게 된다. 이 경우, 고품위의 리얼리티가 있는 음성을 합성하기 위해서는 무성음 포만트를 형성하는 파형 데이터에 노이즈를 가산하는 것이 적합하다.
본 발명의 제3 면은 이상 설명한 바와 같이, 복수개의 파형 테이블 음성부인 포만트 형성부에 의해 원하는 유성음 포만트 또는 원하는 무성음 포만트를 형성하고, 형성된 복수개의 유성음 포만트 또는 복수개의 무성음 포만트를 합성하는 것에 의해 유성음 또는 무성음을 합성하고 있다. 그리고, 유성음 포만트를 형성하는 파형 데이터에 피치 주기의 엔벨로프 신호를 부여하도록 하고 있다. 이에 의해, 유성음 포만트에 피치감을 갖게 할 수 있어, 고품위의 리얼리티가 있는 음성을 합성할 수 있게 된다. 또, 무성음 포만트를 형성하는 상기 파형 데이터에 노이즈를 부여하는 것에 의해, 보다 고품위의 리얼리티가 있는 음성을 합성할 수 있게 된다.
본 발명의 제4 면은 이상 설명한 바와 같이, 복수개의 파형 테이블 음성부인 복수개의 포만트 형성부에 의해 원하는 포만트 중심 주파수 및 원하는 포만트 레벨을 각각 갖는 포만트를 형성하고, 형성된 복수개의 포만트를 합성하는 것에 의해 음성을 합성하고 있다. 그리고, 포만트를 형성하는 파형 데이터에 피치 주기의 엔벨로프 신호를 부여하도록 하고 있다. 이에 의해, 포만트에 피치감을 갖게 할 수 있어, 고품위의 리얼리티가 있는 음성을 합성할 수 있게 된다. 또, 유성음 포만트를 형성하는 파형 데이터에 피치 주기의 엔벨로프 신호를 부여하는 것에 의해, 유성음 포만트에 피치감을 갖게 할 수 있다.
이와 같이 본 발명은, 복수개의 파형 테이블 음성부로부터 악음 파라미터에 기초하여 출력되는 파형 데이터를 믹싱하는 것에 의해 복수개의 악음을 발생시킬 수 있으며, 복수개의 파형 테이블 음성부로부터 음성 파라미터에 기초하여 출력되는 유성음 포만트 혹은 무성음 포만트를 형성하는 파형 데이터를 합성하는 것에 의해 음성을 합성할 수 있다. 이와 같이, 복수개의 파형 테이블 음성부를 악음 발생과 음성 합성 모두 겸용할 수 있기 때문에, 본 발명의 제2 면 내지 제4 면에 따른 음성 합성 장치는 음원 장치와 겸용할 수 있게 된다.

Claims (26)

  1. 웨이브 테이블 음원 모드 또는 음성 합성 모드 중 어느 하나를 나타내는 모드 지정에 따라, 원하는 악음 또는 원하는 포만트 중 어느 하나를 출력하는 복수개의 악음 형성부를 구비하고, 웨이브 테이블 음원 모드시에는 상기 복수개의 악음 형성부는 각각 악음을 발생시킬 수 있으며, 음성 합성 모드시에는 상기 복수개의 악음 형성부는 각각 포만트를 형성하고 또한 형성된 복수개의 포만트로부터 1개의 음성을 합성하는 음성 합성 기능을 갖고,
    상기 복수개의 악음 형성부 각각은,
    복수 종류의 파형 형상 중에서 원하는 파형 형상을 지정하는 파형 형상 지정 수단과,
    상기 복수 종류의 파형 형상에 대응한 복수개의 파형 데이터를 기억하고 있는 파형 데이터 기억 수단과,
    웨이브 테이블 음원 모드시에는 발생해야 할 악음의 음정에 대응한 레이트로 변화하는 어드레스를 발생시킴과 함께, 음성 합성 모드시에는 형성해야 할 포만트의 중심 주파수에 대응한 레이트로 변화하는 어드레스를 발생시켜, 상기 파형 형상 지정 수단에 의해 지정된 파형 형상에 대응한 파형 데이터를 상기 파형 데이터 기억 수단으로부터 판독하는 파형 데이터 판독 수단과,
    웨이브 테이블 음원 모드시에는 발음 개시 지시에 연동하여 상승함과 함께 발음 종료 지시에 연동하여 감쇠되는 엔벨로프 신호를 생성하고, 음성 합성 모드시에는 합성해야 할 음성의 피치 주기에 대응한 타이밍마다 급속하게 감쇠됨과 함께 감쇠 후에 급속하게 상승하는 형상의 엔벨로프 신호를 생성하여, 상기 생성한 엔벨로프 신호를 상기 파형 데이터 판독 수단에 의해 상기 파형 데이터 기억 수단으로부터 판독된 파형 데이터에 부여하는 엔벨로프 부여 수단
    을 포함하는 것을 특징으로 하는 음원 장치.
  2. 웨이브 테이블 음원 모드 또는 음성 합성 모드 중 어느 하나를 나타내는 모드 지정에 따라, 원하는 악음 또는 원하는 포만트 중 어느 하나를 출력하는 복수개의 악음 형성부를 구비하고, 웨이브 테이블 음원 모드시에는 상기 복수개의 악음 형성부는 각각 악음이 발생 가능하고, 음성 합성 모드시에는 상기 복수개의 악음 형성부는 각각 포만트를 형성하고 또한 형성된 복수개의 포만트로부터 1개의 음성을 합성하는 음성 합성 기능을 갖고,
    상기 복수개의 악음 형성부 각각은,
    복수 종류의 파형 형상 중에서 원하는 파형 형상을 지정하는 파형 형상 지정 수단과,
    상기 복수 종류의 파형 형상에 대응한 복수개의 파형 데이터를 기억하고 있는 파형 데이터 기억 수단과,
    웨이브 테이블 음원 모드시에는 발생해야 할 악음의 음정에 대응한 레이트로 변화하는 어드레스를 발생시킴과 함께, 음성 합성 모드시에는 형성해야 할 포만트의 중심 주파수에 대응한 레이트로 변화하는 어드레스를 발생시켜, 상기 파형 형상지정 수단에 의해 지정된 파형 형상에 대응한 파형 데이터를 상기 파형 데이터 기억 수단으로부터 판독하는 파형 데이터 판독 수단과,
    발음 개시 지시에 연동하여 상승함과 함께 발음 종료 지시에 연동하여 감쇠되는 엔벨로프 신호를 생성하여, 상기 생성한 엔벨로프 신호를 상기 파형 데이터 판독 수단에 의해 상기 파형 데이터 기억 수단으로부터 판독된 파형 데이터에 부여하는 엔벨로프 부여 수단과,
    음성 합성 모드시에, 상기 엔벨로프 부여 수단에 의해 엔벨로프 부여된 파형 데이터에 노이즈를 부여하는 노이즈 부여 수단
    을 포함하도록 하는 것을 특징으로 하는 음원 장치.
  3. 원하는 포만트 중심 주파수 및 원하는 포만트 레벨을 갖는 포만트를 각각 형성하는 복수개의 포만트 형성부를 구비하고, 상기 복수개의 포만트 형성부에 의해 형성된 복수개의 포만트를 합성하는 것에 의해 음성을 합성하는 음성 합성 장치로서,
    상기 복수개의 포만트 형성부 각각은,
    소정의 파형 형상에 대응한 파형 데이터를 기억하고 있는 파형 데이터 기억 수단과,
    상기 포만트 중심 주파수에 대응한 레이트로 변화하는 어드레스를 발생시켜 상기 파형 데이터 기억 수단에 기억된 파형 데이터를 판독하는 파형 데이터 판독 수단과,
    상기 파형 데이터 판독 수단에 의해 상기 파형 데이터 기억 수단으로부터 판독된 파형 데이터에 노이즈를 부여하는 노이즈 부여 수단
    을 포함하는 것을 특징으로 하는 음성 합성 장치.
  4. 제3항에 있어서,
    발음 개시 지시에 연동하여 상승함과 함께 발음 정지 지시에 연동하여 감쇠되는 엔벨로프 신호를 형성하고, 상기 형성한 엔벨로프 신호를 상기 파형 데이터 판독 수단에 의해 상기 파형 데이터 기억 수단으로부터 판독된 파형 데이터, 혹은 상기 노이즈 부여 수단에 의해 노이즈가 부여된 파형 데이터에 부여하는 엔벨로프 부여 수단을
    더 포함하는 것을 특징으로 하는 음성 합성 장치.
  5. 제3항에 있어서,
    상기 포만트 형성부의 출력에 대하여 상기 포만트 레벨에 대응한 레벨 데이터를 승산하는 승산 수단을 더 포함하도록 한 것을 특징으로 하는 음성 합성 장치.
  6. 제5항에 있어서,
    상기 복수개의 포만트 형성부로부터 출력되는 원하는 포만트 중심 주파수 및 원하는 포만트 레벨을 갖는 복수개의 포만트를 합성하는 것에 의해, 무성음이 생성되는 것을 특징으로 하는 음성 합성 장치.
  7. 제3항에 있어서,
    상기 파형 데이터 기억 수단은 사인 파형 데이터를 기억하고 있는 것을 특징으로 하는 음성 합성 장치.
  8. 제3항에 있어서,
    상기 노이즈 부여 수단에 의해 부여되는 노이즈는 백색 잡음을 필터에 의해 대역 제한하도록 한 것을 특징으로 하는 음성 합성 장치.
  9. 유성음 합성 모드 또는 무성음 합성 모드 중 어느 하나를 나타내는 모드 지정에 따라, 원하는 유성음 포만트 또는 원하는 무성음 포만트 중 어느 하나를 형성하는 복수개의 포만트 형성부로 이루어지며,
    상기 복수개의 포만트 형성부는 형성한 복수개의 유성음 포만트 또는 복수개의 무성음 포만트를 합성하는 것에 의해 유성음 또는 무성음을 합성하고,
    상기 복수개의 포만트 형성부 각각은,
    소정의 파형 형상에 대응한 파형 데이터를 기억하고 있는 파형 데이터 기억 수단과,
    상기 포만트 중심 주파수에 대응한 레이트로 변화하는 어드레스를 발생시켜 상기 파형 데이터 기억 수단에 기억된 파형 데이터를 판독하는 파형 데이터 판독 수단과,
    유성음 합성 모드시에는 피치 주기에 대응한 타이밍마다 급속하게 감쇠됨과 함께 감쇠 후에 급속하게 상승하는 형상의 엔벨로프 신호를 생성하고, 무성음 합성 모드시에는 발음 개시 지시에 연동하여 상승함과 함께 발음 종료 지시에 연동하여 감쇠되는 엔벨로프 신호를 생성하여, 상기 생성한 엔벨로프 신호를 상기 파형 데이터 판독 수단에 의해 상기 파형 데이터 기억 수단으로부터 판독된 파형 데이터에 부여하는 엔벨로프 부여 수단
    을 포함하는 것을 특징으로 하는 음성 합성 장치.
  10. 제9항에 있어서,
    무성음 합성 모드시에 상기 파형 데이터 판독 수단에 의해 상기 파형 데이터 기억 수단으로부터 판독된 파형 데이터에 노이즈를 부여하는 노이즈 부여 수단이, 상기 복수개의 포만트 형성부에 더 포함되어 있는 것을 특징으로 하는 음성 합성 장치.
  11. 유성음 합성 모드 또는 무성음 합성 모드 중 어느 하나를 나타내는 모드 지정에 따라, 원하는 유성음 포만트 또는 원하는 무성음 포만트 중 어느 하나를 형성하는 복수개의 포만트 형성부로 이루어지며,
    상기 복수개의 포만트 형성부는 형성한 복수개의 유성음 포만트 또는 복수개의 무성음 포만트를 합성하는 것에 의해 유성음 또는 무성음을 합성하고,
    상기 복수개의 포만트 형성부 각각은,
    복수 종류의 파형 형상에 대응한 복수개의 파형 데이터를 기억하고 있는 파형 데이터 기억 수단과,
    유성음 합성 모드시에는 상기 복수 종류의 파형 형상 중에서 원하는 파형 형상을 지정하는 한편, 무성음 합성 모드시에는 미리 정해진 소정의 파형 형상을 지정하는 파형 형상 지정 수단과,
    포만트 중심 주파수에 대응한 레이트로 변화하는 어드레스를 발생시켜, 상기 파형 형상 지정 수단에 의해 지정된 파형 형상에 대응한 파형 데이터를 상기 파형 데이터 기억 수단으로부터 판독하는 파형 데이터 판독 수단과,
    유성음 합성 모드시에는 피치 주기에 대응한 타이밍마다 급속하게 감쇠됨과 함께 감쇠 후에 급속하게 상승하는 형상의 엔벨로프 신호를 생성하고, 무성음 합성 모드시에는 발음 개시 지시에 연동하여 상승함과 함께 발음 종료 지시에 연동하여 감쇠되는 엔벨로프 신호를 생성하여, 상기 생성한 엔벨로프 신호를 상기 파형 데이터 판독 수단에 의해 상기 파형 데이터 기억 수단으로부터 판독된 파형 데이터에 부여하는 엔벨로프 부여 수단
    을 포함하는 것을 특징으로 하는 음성 합성 장치.
  12. 제11항에 있어서,
    무성음 합성 모드시에 상기 파형 데이터 판독 수단에 의해 상기 파형 데이터 기억 수단으로부터 판독된 파형 데이터에 노이즈를 부여하는 노이즈 부여 수단이, 상기 복수개의 포만트 형성부에 더 포함되어 있는 것을 특징으로 하는 음성 합성장치.
  13. 원하는 포만트 중심 주파수 및 원하는 포만트 레벨을 갖는 포만트를 각각 형성하는 복수개의 포만트 형성부를 구비하고, 상기 복수개의 포만트 형성부에 의해 형성된 복수개의 포만트를 합성하는 것에 의해 음성을 합성하는 음성 합성 장치로서,
    상기 복수개의 포만트 형성부 각각은,
    복수 종류의 파형 형상 중에서 원하는 파형 형상을 지정하는 파형 형상 지정 수단과,
    상기 복수 종류의 파형 형상에 대응한 복수개의 파형 데이터를 기억하는 파형 데이터 기억 수단과,
    상기 포만트 중심 주파수에 대응한 레이트로 변화하는 어드레스를 발생시켜, 상기 파형 형상 지정 수단에 의해 지정된 파형 형상에 대응한 파형 데이터를 상기 파형 데이터 기억 수단으로부터 판독하는 파형 데이터 판독 수단과,
    상기 피치 주기에 대응한 타이밍마다 급속하게 감쇠됨과 함께 감쇠 후에 급속하게 상승하는 형상의 엔벨로프 신호를 형성하고, 상기 형성한 엔벨로프 신호를 상기 파형 데이터 판독 수단에 의해 상기 파형 데이터 기억 수단으로부터 판독된 파형 데이터에 부여하는 엔벨로프 부여 수단
    을 포함하는 것을 특징으로 하는 음성 합성 장치.
  14. 제13항에 있어서,
    상기 복수개의 포만트 형성부에 의해 형성된 복수개의 포만트를 합성하는 것에 의해 유성음이 합성되는 것을 특징으로 하는 음성 합성 장치.
  15. 웨이브 테이블 음원 모드 또는 음성 합성 모드 중 어느 하나를 나타내는 모드 지정에 따라, 원하는 악음 또는 원하는 포만트 중 어느 하나를 출력하는 복수개의 악음 형성부로 이루어지는 음원 장치를 제어하여, 웨이브 테이블 음원 모드시에는 상기 복수개의 악음 형성부에 의해 각각 악음이 발생 가능하고, 음성 합성 모드시에는 상기 복수개의 악음 형성부에 의해 각각 포만트를 형성하고 또한 형성된 복수개의 포만트로부터 1개의 음성을 합성 가능하게 하기 위해,
    상기 복수개의 악음 형성부 각각에 대하여,
    복수 종류의 파형 형상 중에서 원하는 파형 형상을 지정하는 파형 형상 지정 단계와,
    상기 복수 종류의 파형 형상에 대응한 복수개의 파형 데이터를 메모리에 기억시켜 두는 파형 데이터 기억 단계와,
    웨이브 테이블 음원 모드시에는 발생시켜야 할 악음의 음정에 대응한 레이트로 변화하는 어드레스를 발생시킴과 함께, 음성 합성 모드시에는 형성해야 할 포만트의 중심 주파수에 대응한 레이트로 변화하는 어드레스를 발생시켜, 상기 파형 형상 지정 단계에서 지정된 파형 형상에 대응한 파형 데이터를 상기 메모리로부터 판독하는 파형 데이터 판독 단계와,
    웨이브 테이블 음원 모드시에는 발음 개시 지시에 연동하여 상승함과 함께 발음 종료 지시에 연동하여 감쇠되는 엔벨로프 신호를 생성하는, 음성 합성 모드시에는 합성시켜야 할 음성의 피치 주기에 대응한 타이밍마다 급속하게 감쇠됨과 함께 감쇠 후에 급속하게 상승하는 형상의 엔벨로프 신호를 생성하여, 상기 생성한 엔벨로프 신호를 상기 파형 데이터 판독 단계에서 상기 메모리로부터 판독된 파형 데이터에 부여하는 엔벨로프 부여 단계
    를 행하는 것을 특징으로 하는 음원 장치의 제어 방법.
  16. 웨이브 테이블 음원 모드 또는 음성 합성 모드 중 어느 하나를 나타내는 모드 지정에 따라, 원하는 악음 또는 원하는 포만트 중 어느 하나를 출력하는 복수개의 악음 형성부를 구비한 음원 장치를 제어하여, 웨이브 테이블 음원 모드시에는 상기 복수개의 악음 형성부에 의해 각각 악음이 발생 가능하고, 음성 합성 모드시에는 상기 복수개의 악음 형성부에 의해 각각 포만트를 형성하고 또한 형성된 복수개의 포만트로부터 1개의 음성을 합성하기 위해,
    상기 복수개의 악음 형성부 각각에 대하여,
    복수 종류의 파형 형상 중에서 원하는 파형 형상을 지정하는 파형 형상 지정 단계와,
    상기 복수 종류의 파형 형상에 대응한 복수개의 파형 데이터를 메모리에 기억시켜 두는 파형 데이터 기억 단계와,
    웨이브 테이블 음원 모드시에는 발생시켜야 할 악음의 음정에 대응한 레이트로 변화하는 어드레스를 발생시킴과 함께, 음성 합성 모드시에는 형성해야 할 포만트의 중심 주파수에 대응한 레이트로 변화하는 어드레스를 발생시켜, 상기 파형 형상 지정 단계에서 지정된 파형 형상에 대응한 파형 데이터를 상기 메모리로부터 판독하는 파형 데이터 판독 단계와,
    발음 개시 지시에 연동하여 상승함과 함께 발음 종료 지시에 연동하여 감쇠되는 엔벨로프 신호를 생성하여, 상기 생성한 엔벨로프 신호를 상기 파형 데이터 판독 단계에서 상기 메모리로부터 판독된 파형 데이터에 부여하는 엔벨로프 부여 단계와,
    음성 합성 모드시에, 상기 엔벨로프 부여 단계에서 엔벨로프 부여된 파형 데이터에 노이즈를 부여하는 노이즈 부여 단계
    를 행하는 것을 특징으로 하는 음원 장치의 제어 방법.
  17. 원하는 포만트 중심 주파수 및 원하는 포만트 레벨을 갖는 포만트를 각각 형성하는 복수개의 포만트 형성부를 구비하고, 상기 복수개의 포만트 형성부에 의해 형성된 복수개의 포만트를 합성하는 것에 의해 음성을 합성하는 음성 합성 장치의 제어 방법으로서,
    상기 복수개의 포만트 형성부 각각에 대하여,
    소정의 파형 형상에 대응한 파형 데이터를 메모리에 기억해 두는 파형 데이터 기억 단계와,
    상기 포만트 중심 주파수에 대응한 레이트로 변화하는 어드레스를 발생시켜상기 메모리에 기억된 파형 데이터를 판독하는 파형 데이터 판독 단계와,
    상기 파형 데이터 판독 단계에서 상기 메모리로부터 판독된 파형 데이터에 노이즈를 부여하는 노이즈 부여 단계
    를 행하는 것을 특징으로 하는 음성 합성 장치의 제어 방법.
  18. 유성음 합성 모드 또는 무성음 합성 모드 중 어느 하나를 나타내는 모드 지정에 따라, 원하는 유성음 포만트 또는 원하는 무성음 포만트 중 어느 하나를 형성하는 복수개의 포만트 형성부로 이루어지는 음성 합성 장치를 제어하여, 상기 복수개의 포만트 형성부에 의해 형성한 복수개의 유성음 포만트 또는 복수개의 무성음 포만트를 합성하는 것에 의해 유성음 또는 무성음을 합성하기 위해,
    상기 복수개의 포만트 형성부 각각에 대하여,
    소정의 파형 형상에 대응한 파형 데이터를 메모리에 기억해 두는 파형 데이터 기억 단계와,
    상기 포만트 중심 주파수에 대응한 레이트로 변화하는 어드레스를 발생시켜 상기 메모리에 기억된 파형 데이터를 판독하는 파형 데이터 판독 단계와,
    유성음 합성 모드시에는 피치 주기에 대응한 타이밍마다 급속하게 감쇠됨과 함께 감쇠 후에 급속하게 상승하는 형상의 엔벨로프 신호를 생성하고, 무성음 합성 모드시에는 발음 개시 지시에 연동하여 상승함과 함께 발음 종료 지시에 연동하여 감쇠되는 엔벨로프 신호를 생성하며, 상기 생성한 엔벨로프 신호를 상기 파형 데이터 판독 단계에서 상기 메모리로부터 판독된 파형 데이터에 부여하는 엔벨로프 부여 단계
    를 행하는 것을 특징으로 하는 음성 합성 장치의 제어 방법.
  19. 유성음 합성 모드 또는 무성음 합성 모드 중 어느 하나를 나타내는 모드 지정에 따라, 원하는 유성음 포만트 또는 원하는 무성음 포만트 중 어느 하나를 형성하는 복수개의 포만트 형성부로 이루어지는 음성 합성 장치를 제어하여, 상기 복수개의 포만트 형성부에 의해 형성한 복수개의 유성음 포만트 또는 복수개의 무성음 포만트를 합성하는 것에 의해 유성음 또는 무성음을 합성하기 위해,
    상기 복수개의 포만트 형성부 각각에 대하여,
    복수 종류의 파형 형상에 대응한 복수개의 파형 데이터를 메모리에 기억해 두는 파형 데이터 기억 단계와,
    유성음 합성 모드시에는 상기 복수 종류의 파형 형상 중에서 원하는 파형 형상을 지정하는 한편, 무성음 합성 모드시에는 미리 정해진 소정의 파형 형상을 지정하는 파형 형상 지정 단계와,
    포만트 중심 주파수에 대응한 레이트로 변화하는 어드레스를 발생시켜, 상기 파형 형상 지정 단계에서 지정된 파형 형상에 대응한 파형 데이터를 상기 메모리로부터 판독하는 파형 데이터 판독 단계와,
    유성음 합성 모드시에는 피치 주기에 대응한 타이밍마다 급속하게 감쇠됨과 함께 감쇠 후에 급속하게 상승하는 형상의 엔벨로프 신호를 생성하고, 무성음 합성 모드시에는 발음 개시 지시에 연동하여 상승함과 함께 발음 종료 지시에 연동하여감쇠되는 엔벨로프 신호를 생성하여, 상기 생성한 엔벨로프 신호를 상기 파형 데이터 판독 단계에서 상기 메모리로부터 판독된 파형 데이터에 부여하는 엔벨로프 부여 단계
    를 행하는 것을 특징으로 하는 음성 합성 장치의 제어 방법.
  20. 원하는 포만트 중심 주파수 및 원하는 포만트 레벨을 갖는 포만트를 각각 형성하는 복수개의 포만트 형성부를 구비하고, 상기 복수개의 포만트 형성부에 의해 형성된 복수개의 포만트를 합성하는 것에 의해 음성을 합성하는 음성 합성 장치의 제어 방법으로서,
    상기 복수개의 포만트 형성부 각각에 대하여,
    복수 종류의 파형 형상 중에서 원하는 파형 형상을 지정하는 파형 형상 지정 단계와,
    상기 복수 종류의 파형 형상에 대응한 복수개의 파형 데이터를 메모리에 기억해 두는 파형 데이터 기억 단계와,
    상기 포만트 중심 주파수에 대응한 레이트로 변화하는 어드레스를 발생시켜, 상기 파형 형상 지정 단계에서 지정된 파형 형상에 대응한 파형 데이터를 상기 메모리로부터 판독하는 파형 데이터 판독 단계와,
    상기 피치 주기에 대응한 타이밍마다 급속하게 감쇠됨과 함께 감쇠 후에 급속하게 상승하는 형상의 엔벨로프 신호를 형성하고, 상기 형성한 엔벨로프 신호를 상기 파형 데이터 판독 단계에서 상기 메모리로부터 판독된 파형 데이터에 부여하는 엔벨로프 부여 단계
    를 행하는 것을 특징으로 하는 음성 합성 장치의 제어 방법.
  21. 웨이브 테이블 음원 모드 또는 음성 합성 모드 중 어느 하나를 나타내는 모드 지정에 따라, 원하는 악음 또는 원하는 포만트 중 어느 하나를 출력하는 복수개의 악음 형성부로 이루어지는 음원 장치를 제어하여, 웨이브 테이블 음원 모드시에는 상기 복수개의 악음 형성부에 의해 각각 악음을 발생시킬 수 있으며, 음성 합성 모드시에는 상기 복수개의 악음 형성부에 의해 각각 포만트를 형성하고 또한 형성된 복수개의 포만트로부터 1개의 음성을 합성 가능하게 하기 위해,
    상기 복수개의 악음 형성부 각각에 대하여,
    복수 종류의 파형 형상 중에서 원하는 파형 형상을 지정하는 파형 형상 지정 단계와,
    상기 복수 종류의 파형 형상에 대응한 복수개의 파형 데이터를 메모리에 기억시켜 두는 파형 데이터 기억 단계와,
    웨이브 테이블 음원 모드시에는 발생해야 할 악음의 음정에 대응한 레이트로 변화하는 어드레스를 발생시킴과 함께, 음성 합성 모드시에는 형성해야 할 포만트의 중심 주파수에 대응한 레이트로 변화하는 어드레스를 발생시켜, 상기 파형 형상 지정 단계에서 지정된 파형 형상에 대응한 파형 데이터를 상기 메모리로부터 판독하는 파형 데이터 판독 단계와,
    웨이브 테이블 음원 모드시에는 발음 개시 지시에 연동하여 상승함과 함께발음 종료 지시에 연동하여 감쇠되는 엔벨로프 신호를 생성하고, 음성 합성 모드시에는 합성해야 할 음성의 피치 주기에 대응한 타이밍마다 급속하게 감쇠됨과 함께 감쇠 후에 급속하게 상승하는 형상의 엔벨로프 신호를 생성하여, 상기 생성한 엔벨로프 신호를 상기 파형 데이터 판독 단계에서 상기 메모리로부터 판독된 파형 데이터에 부여하는 엔벨로프 부여 단계
    를 실행하는 음원 장치 제어용 컴퓨터 프로그램을 기록한 기록매체.
  22. 웨이브 테이블 음원 모드 또는 음성 합성 모드 중 어느 하나를 나타내는 모드 지정에 따라, 원하는 악음 또는 원하는 포만트 중 어느 하나를 출력하는 복수개의 악음 형성부를 구비한 음원 장치를 제어하여, 웨이브 테이블 음원 모드시에는 상기 복수개의 악음 형성부에 의해 각각 악음이 발생 가능하며, 음성 합성 모드시에는 상기 복수개의 악음 형성부에 의해 각각 포만트를 형성하고 또한 형성된 복수개의 포만트로부터 1개의 음성을 합성하기 위해,
    상기 복수개의 악음 형성부 각각에 대하여,
    복수 종류의 파형 형상 중에서 원하는 파형 형상을 지정하는 파형 형상 지정 단계와,
    상기 복수 종류의 파형 형상에 대응한 복수개의 파형 데이터를 메모리에 기억시켜 두는 파형 데이터 기억 단계와,
    웨이브 테이블 음원 모드시에는 발생해야 할 악음의 음정에 대응한 레이트로 변화하는 어드레스를 발생시킴과 함께, 음성 합성 모드시에는 형성해야 할 포만트의 중심 주파수에 대응한 레이트로 변화하는 어드레스를 발생시켜, 상기 파형 형상 지정 단계에서 지정된 파형 형상에 대응한 파형 데이터를 상기 메모리로부터 판독하는 파형 데이터 판독 단계와,
    발음 개시 지시에 연동하여 상승함과 함께 발음 종료 지시에 연동하여 감쇠되는 엔벨로프 신호를 생성하여, 상기 생성한 엔벨로프 신호를 상기 파형 데이터 판독 단계에서 상기 메모리로부터 판독된 파형 데이터에 부여하는 엔벨로프 부여 단계와,
    음성 합성 모드시에, 상기 엔벨로프 부여 단계에서 엔벨로프 부여된 파형 데이터에 노이즈를 부여하는 노이즈 부여 단계
    를 행하는 것을 특징으로 하는 음원 장치 제어용 컴퓨터 프로그램을 기록한 기록매체.
  23. 원하는 포만트 중심 주파수 및 원하는 포만트 레벨을 갖는 포만트를 각각 형성하는 복수개의 포만트 형성부를 구비하고, 상기 복수개의 포만트 형성부에 의해 형성된 복수개의 포만트를 합성하는 것에 의해 음성을 합성하는 음성 합성 장치를 제어하기 위해 이용하는 컴퓨터 프로그램을 기록한 기록매체로서,
    상기 복수개의 포만트 형성부 각각에 대하여,
    소정의 파형 형상에 대응한 파형 데이터를 메모리에 기억해 두는 파형 데이터 기억 단계와,
    상기 포만트 중심 주파수에 대응한 레이트로 변화하는 어드레스를 발생시켜상기 메모리에 기억된 파형 데이터를 판독하는 파형 데이터 판독 단계와,
    상기 파형 데이터 판독 단계에서 상기 메모리로부터 판독된 파형 데이터에 노이즈를 부여하는 노이즈 부여 단계
    를 행하는 것을 특징으로 하는 음성 합성 장치 제어용 컴퓨터 프로그램을 기록한 기록매체.
  24. 유성음 합성 모드 또는 무성음 합성 모드 중 어느 하나를 나타내는 모드 지정에 따라, 원하는 유성음 포만트 또는 원하는 무성음 포만트 중 어느 하나를 형성하는 복수개의 포만트 형성부로 이루어지는 음성 합성 장치를 제어하여, 상기 복수개의 포만트 형성부에 의해 형성한 복수개의 유성음 포만트 또는 복수개의 무성음 포만트를 합성하는 것에 의해 유성음 또는 무성음을 합성하기 위해,
    상기 복수개의 포만트 형성부 각각에 대하여,
    소정의 파형 형상에 대응한 파형 데이터를 메모리에 기억해 두는 파형 데이터 기억 단계와,
    상기 포만트 중심 주파수에 대응한 레이트로 변화하는 어드레스를 발생시켜 상기 메모리에 기억된 파형 데이터를 판독하는 파형 데이터 판독 단계와,
    유성음 합성 모드시에는 피치 주기에 대응한 타이밍마다 급속하게 감쇠됨과 함께 감쇠 후에 급속하게 상승하는 형상의 엔벨로프 신호를 생성하고, 무성음 합성 모드시에는 발음 개시 지시에 연동하여 상승함과 함께 발음 종료 지시에 연동하여 감쇠되는 엔벨로프 신호를 생성하여, 상기 생성한 엔벨로프 신호를 상기 파형 데이터 판독 단계에서 상기 메모리로부터 판독된 파형 데이터에 부여하는 엔벨로프 부여 단계
    를 실행하는 것을 특징으로 하는 음성 합성 장치 제어용 컴퓨터 프로그램을 기록한 기록매체.
  25. 유성음 합성 모드 또는 무성음 합성 모드 중 어느 하나를 나타내는 모드 지정에 따라, 원하는 유성음 포만트 또는 원하는 무성음 포만트 중 어느 하나를 형성하는 복수개의 포만트 형성부로 이루어지는 음성 합성 장치를 제어하여, 상기 복수개의 포만트 형성부에 의해 형성한 복수개의 유성음 포만트 또는 복수개의 무성음 포만트를 합성하는 것에 의해 유성음 또는 무성음을 합성하기 위해,
    상기 복수개의 포만트 형성부 각각에 대하여,
    복수 종류의 파형 형상에 대응한 복수개의 파형 데이터를 메모리에 기억해 두는 파형 데이터 기억 단계와,
    유성음 합성 모드시에는 상기 복수 종류의 파형 형상 중에서 원하는 파형 형상을 지정하는 한편, 무성음 합성 모드시에는 미리 정해진 소정의 파형 형상을 지정하는 파형 형상 지정 단계와,
    포만트 중심 주파수에 대응한 레이트로 변화하는 어드레스를 발생시켜, 상기 파형 형상 지정 단계에서 지정된 파형 형상에 대응한 파형 데이터를 상기 메모리로부터 판독하는 파형 데이터 판독 단계와,
    유성음 합성 모드시에는 피치 주기에 대응한 타이밍마다 급속하게 감쇠됨과함께 감쇠 후에 급속하게 상승하는 형상의 엔벨로프 신호를 생성하고, 무성음 합성 모드시에는 발음 개시 지시에 연동하여 상승함과 함께 발음 종료 지시에 연동하여 감쇠되는 엔벨로프 신호를 생성하여, 상기 생성한 엔벨로프 신호를 상기 파형 데이터 판독 단계에서 상기 메모리로부터 판독된 파형 데이터에 부여하는 엔벨로프 부여 단계
    를 실행하는 것을 특징으로 하는 음성 합성 장치 제어용 컴퓨터 프로그램을 기록한 기록매체.
  26. 원하는 포만트 중심 주파수 및 원하는 포만트 레벨을 갖는 포만트를 각각 형성하는 복수개의 포만트 형성부를 구비하여, 해당 복수개의 포만트 형성부에 의해 형성된 복수개의 포만트를 합성하는 것에 의해 음성을 합성하는 음성 합성 장치의 제어에 이용하는 컴퓨터 프로그램을 기록한 기록매체로서,
    상기 복수개의 포만트 형성부 각각에 대하여,
    복수 종류의 파형 형상 중에서 원하는 파형 형상을 지정하는 파형 형상 지정 단계와,
    상기 복수 종류의 파형 형상에 대응한 복수개의 파형 데이터를 메모리에 기억해 두는 파형 데이터 기억 단계와,
    상기 포만트 중심 주파수에 대응한 레이트로 변화하는 어드레스를 발생시켜, 상기 파형 형상 지정 단계에서 지정된 파형 형상에 대응한 파형 데이터를 상기 메모리로부터 판독하는 파형 데이터 판독 단계와,
    상기 피치 주기에 대응한 타이밍마다 급속하게 감쇠됨과 함께 감쇠 후에 급속하게 상승하는 형상의 엔벨로프 신호를 형성하고, 상기 형성한 엔벨로프 신호를 상기 파형 데이터 판독 단계에서 상기 메모리로부터 판독된 파형 데이터에 부여하는 엔벨로프 부여 단계
    를 실행하는 것을 특징으로 하는 음성 합성 장치 제어용 컴퓨터 프로그램을 기록한 기록매체.
KR1020040005697A 2003-01-30 2004-01-29 음원 장치 및 음성 합성 장치 KR100602979B1 (ko)

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
JP2003021681A JP3915703B2 (ja) 2003-01-30 2003-01-30 音声合成装置
JP2003021682A JP3797333B2 (ja) 2003-01-30 2003-01-30 音声合成機能を有する音源装置
JP2003021683A JP3915704B2 (ja) 2003-01-30 2003-01-30 音声合成装置
JPJP-P-2003-00021682 2003-01-30
JPJP-P-2003-00021680 2003-01-30
JP2003021680A JP2004233621A (ja) 2003-01-30 2003-01-30 音声合成装置
JPJP-P-2003-00021683 2003-01-30
JPJP-P-2003-00021681 2003-01-30

Publications (2)

Publication Number Publication Date
KR20040070049A true KR20040070049A (ko) 2004-08-06
KR100602979B1 KR100602979B1 (ko) 2006-07-20

Family

ID=32660055

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020040005697A KR100602979B1 (ko) 2003-01-30 2004-01-29 음원 장치 및 음성 합성 장치

Country Status (5)

Country Link
US (1) US7424430B2 (ko)
EP (1) EP1443493A1 (ko)
KR (1) KR100602979B1 (ko)
CN (2) CN100561574C (ko)
TW (1) TWI240914B (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100598209B1 (ko) * 2004-10-27 2006-07-07 엘지전자 주식회사 Midi 재생 장치 및 방법

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4178319B2 (ja) * 2002-09-13 2008-11-12 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声処理におけるフェーズ・アライメント
US7424430B2 (en) * 2003-01-30 2008-09-09 Yamaha Corporation Tone generator of wave table type with voice synthesis capability
US20050114136A1 (en) * 2003-11-26 2005-05-26 Hamalainen Matti S. Manipulating wavetable data for wavetable based sound synthesis
TWI252468B (en) * 2004-02-13 2006-04-01 Mediatek Inc Wavetable synthesis system with memory management according to data importance and method of the same
US7470849B2 (en) * 2005-10-04 2008-12-30 Via Telecom Co., Ltd. Waveform generation for FM synthesis
US7847177B2 (en) * 2008-07-24 2010-12-07 Freescale Semiconductor, Inc. Digital complex tone generator and corresponding methods
US8798288B2 (en) * 2008-11-26 2014-08-05 Panasonic Corporation Voice output device
EP2416311B1 (en) * 2010-08-03 2014-07-16 Yamaha Corporation Tone generation apparatus
US8818806B2 (en) * 2010-11-30 2014-08-26 JVC Kenwood Corporation Speech processing apparatus and speech processing method
CN104704560B (zh) * 2012-09-04 2018-06-05 纽昂斯通讯公司 共振峰依赖的语音信号增强
CN109671422B (zh) * 2019-01-09 2022-06-17 浙江工业大学 一种获取纯净语音的录音方法
US11183201B2 (en) 2019-06-10 2021-11-23 John Alexander Angland System and method for transferring a voice from one body of recordings to other recordings

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5853351B2 (ja) 1979-10-03 1983-11-29 日本電信電話株式会社 音声合成装置
US4833963A (en) * 1986-03-24 1989-05-30 Kurzweil Music Systems, Inc. Electronic musical instrument using addition of independent partials with digital data bit truncation
JP2564641B2 (ja) * 1989-01-31 1996-12-18 キヤノン株式会社 音声合成装置
JP2745865B2 (ja) 1990-12-15 1998-04-28 ヤマハ株式会社 楽音合成装置
JP2606006B2 (ja) 1991-05-24 1997-04-30 ヤマハ株式会社 ノイズ音発生装置
US5744741A (en) * 1995-01-13 1998-04-28 Yamaha Corporation Digital signal processing device for sound signal processing
JP2812229B2 (ja) 1995-01-13 1998-10-22 ヤマハ株式会社 音声及び楽音合成装置
CN1108602C (zh) * 1995-03-28 2003-05-14 华邦电子股份有限公司 具有音乐旋律的语音合成器
US5703311A (en) * 1995-08-03 1997-12-30 Yamaha Corporation Electronic musical apparatus for synthesizing vocal sounds using format sound synthesis techniques
JP4132109B2 (ja) * 1995-10-26 2008-08-13 ソニー株式会社 音声信号の再生方法及び装置、並びに音声復号化方法及び装置、並びに音声合成方法及び装置
US6610917B2 (en) * 1998-05-15 2003-08-26 Lester F. Ludwig Activity indication, external source, and processing loop provisions for driven vibrating-element environments
US6689947B2 (en) * 1998-05-15 2004-02-10 Lester Frank Ludwig Real-time floor controller for control of music, signal processing, mixing, video, lighting, and other systems
US6993480B1 (en) * 1998-11-03 2006-01-31 Srs Labs, Inc. Voice intelligibility enhancement system
WO2001057485A1 (en) * 2000-02-04 2001-08-09 X-Rite, Incorporated Handheld color measurement instrument
JP3587167B2 (ja) * 2000-02-24 2004-11-10 ヤマハ株式会社 電子楽器
US6865533B2 (en) * 2000-04-21 2005-03-08 Lessac Technology Inc. Text to speech
US7424430B2 (en) * 2003-01-30 2008-09-09 Yamaha Corporation Tone generator of wave table type with voice synthesis capability

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100598209B1 (ko) * 2004-10-27 2006-07-07 엘지전자 주식회사 Midi 재생 장치 및 방법

Also Published As

Publication number Publication date
US20040158470A1 (en) 2004-08-12
TW200421260A (en) 2004-10-16
CN100561574C (zh) 2009-11-18
US7424430B2 (en) 2008-09-09
CN2706830Y (zh) 2005-06-29
TWI240914B (en) 2005-10-01
KR100602979B1 (ko) 2006-07-20
EP1443493A1 (en) 2004-08-04
CN1519815A (zh) 2004-08-11

Similar Documents

Publication Publication Date Title
JP3985814B2 (ja) 歌唱合成装置
US5703311A (en) Electronic musical apparatus for synthesizing vocal sounds using format sound synthesis techniques
KR100602979B1 (ko) 음원 장치 및 음성 합성 장치
US5902951A (en) Chorus effector with natural fluctuation imported from singing voice
JP5648347B2 (ja) 音声合成装置
JP2564641B2 (ja) 音声合成装置
KR100457414B1 (ko) 음성합성방법, 음성합성장치 및 기록매체
US20020138253A1 (en) Speech synthesis method and speech synthesizer
JP4214842B2 (ja) 音声合成装置及び音声合成方法
JP4844623B2 (ja) 合唱合成装置、合唱合成方法およびプログラム
JP3307283B2 (ja) 歌唱音合成装置
JP4304934B2 (ja) 合唱合成装置、合唱合成方法およびプログラム
JP4490818B2 (ja) 定常音響信号のための合成方法
JP5092905B2 (ja) 歌唱合成装置およびプログラム
JP3915704B2 (ja) 音声合成装置
JP4349316B2 (ja) 音声分析及び合成装置、方法、プログラム
EP2634769B1 (en) Sound synthesizing apparatus and sound synthesizing method
JP3915703B2 (ja) 音声合成装置
JP3797333B2 (ja) 音声合成機能を有する音源装置
JP3233036B2 (ja) 歌唱音合成装置
JPH0895588A (ja) 音声合成装置
JP2004061753A (ja) 歌唱音声を合成する方法および装置
JP2004233621A (ja) 音声合成装置
JP5552797B2 (ja) 音声合成装置および音声合成方法
JP3515268B2 (ja) 音声合成装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130618

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20140630

Year of fee payment: 9

LAPS Lapse due to unpaid annual fee