JPS63199400A - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JPS63199400A
JPS63199400A JP62031582A JP3158287A JPS63199400A JP S63199400 A JPS63199400 A JP S63199400A JP 62031582 A JP62031582 A JP 62031582A JP 3158287 A JP3158287 A JP 3158287A JP S63199400 A JPS63199400 A JP S63199400A
Authority
JP
Japan
Prior art keywords
signal
sound source
control means
amplitude
source signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62031582A
Other languages
English (en)
Inventor
純一 田村
桜井 穆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP62031582A priority Critical patent/JPS63199400A/ja
Publication of JPS63199400A publication Critical patent/JPS63199400A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Reciprocating, Oscillating Or Vibrating Motors (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野コ 本発明は音声合成装置に関し、特に周期性信号とノイズ
信号を音源信号として合成する音声合成装置に関する。
[従来の技術] 第10図は従来の音声合成装置のブロック構成図である
。図において、1は有声音源信号PSを発生する有声音
源信号発生手段であり、例えばパルス信号発生器、三角
波信号発生器等の周期信号発生手段より成る。2は無声
音源信号NSを発生する無声音源信号発生手段であり、
例えば白雑音信号発生器より成る。3は有声音源信号p
sと無声音源信号NSの何れかを選択して出力するアナ
ログスイッチ、4はアナログスイッチ3で選択した音源
信号AS(信号ps又はNS)の振幅を制御する音源信
号振幅制御手段、5は音源信号ASで駆動されて音声信
号BSを発生する音源信号共振手段であり、例えば時間
と共に共振特性が変化する時変フィルタ回路(又は共振
器)より成る。
6は合成音声を出力するスピーカである。
かかる構成において、合成音声のピッチ周期はパルス信
号発生器1の基本周期によって決まり、外部からのピッ
チ周期信号でピッチ周期を制御することにより、高い声
から低い声まで合成できる。また、白雑音信号発生器2
は人の呼気の乱流や声道内の狭めにより生ずる摩擦音源
信号が白雑音信号に似ていることから用いられる。そし
て、これらの有声音源信号psと無声音源信号NSは外
部からの有声無声選択信号に従ってアナログスイッチ3
によりその何れか一方が選択され、該選択された信号P
S又はNSは外部からの振幅パラメータに従って音源信
号振幅制御手段4により振幅制御される。更に、こうし
て振幅制御された音源信号ASは時変フィルタ回路4を
駆動し、該フィルタ回路4は外部から音韻的特徴パラメ
ータを時系列に与える音響パラメータ信号に従って音源
信号ASを音声信号BSに変換する。そして、この音声
信号BSはスピーカ6を駆動し、合成音声を出力する。
しかし、上記のような従来装置では、音源信号ASが常
に有声音源信号psか無声音源信号NSでしかないから
、例えば外来音声に特有の有声摩擦音[v]、[5]、
[z]等を合成出力できなかった。
また、このような音源信号ASに微妙な変化を持たせる
といってもおのずと制限があるから、合成音声に声の大
きさ、発声時間長、アクセント等の変化を持たせること
が困難であった。
特に、規則に従って任意の音声を合成できる規則音声合
成装置では、一定の音声素片(フレーム)を単位として
各種の音声を合成するため、その合成音声は単調で機械
的な調子のものとなってしまい、著しく自然性が損なわ
れていた。
[発明が解決しようとする問題点コ 本発明は上述の従来技術の欠点を除去するものであり、
その目的とする所は、有声摩擦音のような音声を明瞭に
合成出力できる音声合成装置を提供することにある。
また本発明の他の目的は、簡単な構成で透明感のある声
、濁った声、しわがれ声等の声色を表現できる音声合成
装置を提供することにある。
また本発明の他の目的は、ゆらぎのある自然性の高い音
声を合成できる音声合成装置を提供することにある。
また本発明の他の目的は、子音部の明瞭度が高い音声合
成装置を提供することにある。
[問題点を解決するための手段] 本発明の音声合成装置は上記の目的を達成するために、
周期性信号の振幅とノイズ信号の振幅を変えて同時に合
成する信号合成手段を備えることをその概要とする。
また好ましくは、信号合成手段は周期性信号のスペクト
ル分布を変化させる周期性信号スペクトル制御手段を備
えることをその一態様とする。
また好ましくは、周期性信号スペクトル制御手段は音声
合成するフレーム情報の読み出しと関連して周期性信号
のスペクトル分布を変化させることをその一態様とする
また好ましくは、信号合成手段はノイズ信号のスペクト
ル分布を変化させるノイズ信号スペクトル制御手段を備
えることをその一態様とする。
また好ましくは、ノイズ信号スペクトル制御手段は音声
合成するフレーム情報の読み出しと関連してノイズ信号
のスペクトル分布を変化させることをその一態様とする
また好ましくは、ノイズ信号スペクトル制御手段はフレ
ーム情報の音韻パラメータの種類に応じてノイズ信号の
スペクトル分布を変化させることをその一態様とする。
[作用コ かかる構成において、信号合成手段は周期性信号の振幅
とノイズ信号の振幅を変えて同時に(オーバラップして
)合成する。その際に、好ましくは、信号合成手段は周
期性信号のスペクトル分布を変化させる周期性信号スペ
クトル制御手段を備え、音声合成するフレーム情報の読
み出しと関連して周期性信号のスペクトル分布を変化さ
せる。また好ましくは、信号合成手段はノイズ信号のス
ペクトル分布を変化させるノイズ信号スペクトル制御手
段を備え、同様にして、音声合成するフレーム情報の読
み出しと関連してノイズ信号のスペクトル分布を変化さ
せる。更に好ましくは、ノイズ信号スペクトル制御手段
はフレーム情報の音韻パラメータの種類に応じてノイズ
信号のスペクトル分布を変化させる。
[実施例の説明コ 以下添付図面に従って本発明の実施例を詳細に説明する
[第1実施例コ 第1実施例は周期性信号の振幅とノイズ信号の振幅を変
えて同時に合成することにより、有声摩擦音やしわがれ
声を発声するものに関する。
第1図は本発明による第1実施例の音声合成装置のブロ
ック構成図である。第10図と同等の構成には同一番号
を付してその説明を省略する。
図において、7は有声音源信号psと無声音源信号NS
を合成して合成音源信号(PS’+Ns’)を出力する
信号合成手段である。前記信号合成手段7は、外部から
時系列で送られるレベル制御信号GPに従って有声音源
信号psの信号レベルを制御する周期信号レベル制御手
段8と、同じく外部から時系列で送られるレベル制御信
号GNに従って無声音源信号NSの信号レベルを制御す
るノイズ信号レベル制御手段9と、これらの各レベル制
御を受けた有声音源信号PS’及び無声音源信号NS’
を加算して合成音源信号(ps’+NS′)を出力する
加算手段10を含む。
更に、11は音響パラメータを含む各種の制御パラメー
タを記憶しているパラメータ記憶手段である。工2は制
御手段であり、該制御手段12はパラメータ記憶手段1
1から各種の制御パラメータを読み出し、有声音源信号
発生手段1にはピッチ周期信号を、信号合成手段7には
レベル制御信号GP及びGNを、音源信号振幅制御手段
4には振幅パラメータ信号を、及び音源信号共振手段5
にを音響パラメータ信号を夫々時系列()L/−ム@)
で送る。
第2図(A)及び(B)は第1図の各部の信号波形を示
す図である。実施例を通して有声音源信号発声手段1に
はパルス信号発生回路を用いている。周期信号として方
形波(パルス)を用いるとその波形は第2図(A)に示
すような信号PSになる。無声音源信号発声手段2には
白雑音信号発生回路を用いている。その出力波形は第2
図(B)に示すような信号NSになる。パルス信号PS
の振幅は周期信号レベル制御手段8によりレベル制御さ
れる。またノイズ信号NSの振幅もノイズ信号レベル制
御手段9によりレベル制御される。レベル制御は時系列
で送られるレベル制御信号GP及びGNに従って夫々独
立に行なわれるが、木実流側では後の音源信号振幅制御
手段4における信号処理の便宜を考え、結果の合成音源
信号(ps’+NS′)の振幅には正規化した出力か得
られるようになっている。即ち、第2図(A)において
、合成音源信号(PS ’+NS ’)の振幅(例えば
最大1.0に正規化)中でパルス信号PSの振幅が占め
る割合RPとノイズ信号NSの振幅が占める割合RNと
の和が最大でも1.0になるようにレベル制御をする。
第2図(A)において、−例の混合比率の推移を見ると
、始めはノイズ信号NSの振幅の占める割合が100%
であり、時間経過と供に図のような曲線に従って混合比
率は変化し、点Qに至って後はパルス信号PSの振幅の
占める割合が100%になっている。即ち、従来のよう
に単にパルス信号PSとノイズ信号NSの何れかが選択
されるのではなく、両信号はその振幅に占める割合を変
えてオーバラップしている。そして、このような混合条
件を満足する振幅制御パラメータGP及びGNは予めパ
ラメータ記憶手段11に記憶させておくことが可能であ
る。
第2図(B)に示す信号ps’及び信号NS′は夫々上
記の混合比率に従って振幅レベルを制御されたパルス信
号とノイズ信号である。加算手段10はパルス信号PS
′及びノイズ信号NS′を加算して合成音源信号(PS
 ’+NS ′)を出力する。この信号波形は第2図(
B)の合成音源信号(PS ′+NS ′)で示されて
いる。こうして、パルス波形とノイズ波形がまじり合っ
た音源信号ができる。この音源信号(ps’+NS′)
は有声音と摩擦音がまじり合った有声摩擦音[S]、[
z]等を合成出力する場合に適している。
第3図は音源信号振幅制御手段4における振幅パラメー
タ信号と出力音源信号AS’との関係を示す図である。
音源振幅制御手段4は時系列で送られる振幅パラメータ
信号に従って合成音源信号らPS′+NS’)の振幅を
図のように制御する。こうして、音源信号共振手段(声
道)5を刺激する音源信号AS′が形成される。そして
、音源信号共振手段5は音源信号AS′で駆動され、音
声信号波形BS”を出力する。
第4図はパラメータ記憶手段11が記憶している各種の
制御パラメータの記憶構造を示す図である。制御パラメ
ータは合成音声の所定時間長に相当するフレーム単位に
時系列なデータとして記憶されており、時間経過と供に
フレーム番号(i−t)、(i)、H+t)等の順序で
読み出される。第4図において、「ピッチ」は有声音源
信号発声手段1に与えるピッチ周期信号のパラメータ、
「パルスレベル」は周期信号レベル制御手段8に与える
レベル制御信号GPのパラメータ、「ノイズレベル」は
ノイズ信号レベル制御手段9に与えるレベル制御信号G
Nのパラメータ、「音源のパワー」は音源信号振幅制御
手段4に与える振幅パラメータ信号のパラメータ、「音
韻パラメータ」は音源信号共振手段5に与える音響パラ
メータ信号のパラメータ(フィルタ係数)である。フィ
ルタ係数はフィルタの構成に対応しており、これにより
各音韻に対応した声道の伝達関数(共振特性)を与える
。一般的には、LPG(線形予測)係数、PARCOR
(偏自己相関)係数、LSP(線スペクトル付)係数、
ケプストラム係数等があり、何れを用いても良い。
第5図はしわがれ声を合成する場合の一例の混合曲線を
示す図である。上記の第4図(A)の有声摩擦音の場合
は点Qの以降ではパルス信号成分が100%になってい
たが、しわがれ声を合成したい場合は、第5図に示すよ
うな混合曲線とすれは良い。即ち、点Q以降でもノイズ
成分に所定のオフセットを与えておくのである。こうす
ると、母音部にも摩擦音が重畳し、声がしわがれる。
今、仮にノイズ成分のオフセット量を0.2とした場合
には、パルス成分の混合比は0.0〜0.8の間で与え
れば良い。
[第2実施例] 第2実施例は、一般に人間の声帯では声が大きくなると
音声信号が正弦波に近くなるという特徴を音源信号に生
かすものであり、例えば周期信号PSに対してスペクト
ル制御を施すことにより、従来、多くの人が°゛ロボツ
ト的゛とイメージしていた合成音声が、より人間の声に
近い“ゆらぎ°′を持つ音声になることに関する。
第6図は本発明による第2実施例の音声合成装置のブロ
ック構成図である。第6図は第1図と相違する点を中心
にして示しである。図において、13は共振手段(パル
ス信号スペクトル制御手段)であり、例えば第7図(A
)に示すように中心周波数F。(=信号psのピッチ周
波数であって可変)、バンド幅BW(cc振幅パラメー
タ信号)の可変共振特性を持つ共振器である。
第7図(B)は第7図(A)の共振特性を満足する一例
の2次の共振系のブロック構成図であり、その伝達特性
T (f)は、 ここで、 c=−e−2LB硬T B=2e−几8ωCo52πFo T A=1−C−B で与えられる。尚、共振手段13はデジタル共振器なの
で人力サンプル係数のサンプリング周期はTとする。か
かる共振手段13を使用し、中心周波数F。=ピッチ周
波数となるように可変し、バンド幅BWを小さくすれば
するほどQが高くなる。よって当該ピッチの周波数成分
が犬になり、高域における周波数成分は小さくなる。よ
って、共振手段13を通過した有声音源信号ps’は正
弦波に近くなる。また、音源の大きさにより、上記のA
、B、Cの値を計算したテーブルを用意しておけば、計
算時間が短縮でき、効率的である。
尚、本実施例では共振手段13を用いたが、音源信号の
特性を示すようなフィルタでも良い。
[第3実施例コ 第3実施例はノイズ信号NSのスペクトル分布を制御す
ることにより、特にささやき声を高品質な音声で出力す
るものに関する。
第8図は木発明による第3実施例の音声合成装置のブロ
ック構成図である。第8図は第1図と相違する点を中心
にして示しである。図において、ノイズ信号スペクトル
制御手段14としては、第2実施例で述べた場合と同様
に、第7図(B)のような構成のディジタル共振器を用
いる事ができる。ささやき声は、従来は、有声音源信号
を使わずに無声音源信号のみを用いて行っていた。しか
し、白雑音信号の周波数成分は低域から高域に至るまで
平坦な特性であるので、ささやき声を出そうとしても、
品質の良いささやき声は合成できなかった。そこで、第
3実施例ではノイズ信号NSのスペクトル分布を制御す
る。
第9図は第8図のノイズ信号スペクトル制御手段14の
一例の周波数特性を示す図である。図のように、中心周
波数FS0を3KHz〜4.5KHz程度とし、またバ
ンド幅BWを200〜1000Hz程度にすると、品質
の良いささやき声が得られた。
また、無声子音を合成する場合を考えると、同じ「S」
でも後に続く母音によってスペクトル分布が異なる。例
えば、「Si」と「Su」では、後者の「S」より前者
の「S」の方が高域におけるスペクトル密度が高い。よ
って、同じ「s」ても、音韻パラメータに従い、ノイズ
信号スペクトル制御手段14により中心周波数FSo、
バンド幅BWを制御すれば、子音の明瞭度が更に向上す
る。
[発明の効果] 以上述べた如く木発明によれば、周期性信号の振幅とノ
イズ信号の振幅を変えて同時に合成することにより、外
来音等に多く使われる有声摩擦音を容易に合成できる。
また、有声区間においてもノイズ信号を混合することに
より、風邪をひいた時の声、しわがれた声等を容易に合
成できる。
また本発明によれば、音声合成するフレーム情報の読み
出しと関連して周期性信号のスペクトルを変化させるこ
とにより、即ち、例えば声の大きさ、ピッチなどに合わ
せて有声音源のスペクトル分布を変化させることにより
、ゆらぎのある自然性の高い音声を合成できる。
また本発明によれば、音声合成するフレーム情報の読み
出しと関連してノイズ信号のスペクトルを変化させるこ
とにより、自然なささやき声を合成できる。
また本発明によれば、フレーム情報の音韻パラメータの
種類に応じてノイズ信号のスペクトル分布を変化させる
ことにより、子音部の明瞭度が格段に向上した。
【図面の簡単な説明】
第1図は本発明による第1実施例の音声合成装置のブロ
ック構成図、 第2図(A)及び(B)は第1図の各部の信号波形を示
す図、 第3図は音源信号振幅制御手段4における振幅パラメー
タ信号と音源信号AS′の関係を示す図、 第4図はパラメータ記憶手段11が記憶している制御パ
ラメータの記憶構造を示す図、第5図はしわがれ声を合
成する場合の一例の混合曲線を示す図、 第6図は本発明による第2実施例の音声合成装置のブロ
ック構成図、 第7図(A)は共振手段13が備える一例の共振特性を
示す図、 第7図(B)は第7図(A)の共振特性を満足する一例
の2次の共振系のブロック構成図、第8図は本発明によ
る第3実施例の音声合成装置のブロック構成図、 第9図は第8図のノイズ信号スペクトル制御手段14が
備える一例の共振特性を示す図、第10図は従来の音声
合成装置のブロック構成図である。 図中、1・・・有声音源信号発生手段、2・・・無声音
源信号発生手段、3・・・スイッチ、4・・・音源信号
振幅制御手段、5・・・音源信号共振手段、6・・・ス
ピーカ、7・・・信号合成手段、8・・・周期信号レベ
ル制御手段、9・・・ノイズ信号レベル制御手段、10
−加算手段、11・・・パラメータ記憶手段、12・・
・制御手段、13・・・共振手段、14・・・ノイズ信
号スペクトル制御手段である。 弐埋人 弁理士   犬塚康徳(化1名)0   0.
5   1   1.5   2   2.5[にHz
] (A) 第7 八n (B) 図

Claims (6)

    【特許請求の範囲】
  1. (1)周期性信号とノイズ信号を音源信号として合成す
    る音声合成装置において、前記周期性信号の振幅と前記
    ノイズ信号の振幅を変えて同時に合成する信号合成手段
    を備えることを特徴とする音声合成装置。
  2. (2)信号合成手段は周期性信号のスペクトル分布を変
    化させる周期性信号スペクトル制御手段を備えることを
    特徴とする特許請求の範囲第1項記載の音声合成装置。
  3. (3)周期性信号スペクトル制御手段は音声合成するフ
    レーム情報の読み出しと関連して周期性信号のスペクト
    ル分布を変化させることを特徴とする特許請求の範囲第
    2項記載の音声合成装置。
  4. (4)信号合成手段はノイズ信号のスペクトル分布を変
    化させるノイズ信号スペクトル制御手段を備えることを
    特徴とする特許請求の範囲第1項又は第2項記載の音声
    合成装置。
  5. (5)ノイズ信号スペクトル制御手段は音声合成するフ
    レーム情報の読み出しと関連してノイズ信号のスペクト
    ル分布を変化させることを特徴とする特許請求の範囲第
    4項記載の音声合成装置。
  6. (6)ノイズ信号スペクトル制御手段はフレーム情報の
    音韻パラメータの種類に応じてノイズ信号のスペクトル
    分布を変化させることを特徴とする特許請求の範囲第5
    項記載の音声合成装置。
JP62031582A 1987-02-16 1987-02-16 音声合成装置 Pending JPS63199400A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62031582A JPS63199400A (ja) 1987-02-16 1987-02-16 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62031582A JPS63199400A (ja) 1987-02-16 1987-02-16 音声合成装置

Publications (1)

Publication Number Publication Date
JPS63199400A true JPS63199400A (ja) 1988-08-17

Family

ID=12335180

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62031582A Pending JPS63199400A (ja) 1987-02-16 1987-02-16 音声合成装置

Country Status (1)

Country Link
JP (1) JPS63199400A (ja)

Similar Documents

Publication Publication Date Title
US4624012A (en) Method and apparatus for converting voice characteristics of synthesized speech
US5704007A (en) Utilization of multiple voice sources in a speech synthesizer
Macon et al. A singing voice synthesis system based on sinusoidal modeling
US5930755A (en) Utilization of a recorded sound sample as a voice source in a speech synthesizer
JPH06110498A (ja) 音声合成システムの音声断片コーディングおよびそのピッチ調節方法とその有声音合成装置
US8103505B1 (en) Method and apparatus for speech synthesis using paralinguistic variation
Macon et al. Concatenation-based midi-to-singing voice synthesis
JP2564641B2 (ja) 音声合成装置
JP3732793B2 (ja) 音声合成方法、音声合成装置及び記録媒体
US20040102975A1 (en) Method and apparatus for masking unnatural phenomena in synthetic speech using a simulated environmental effect
JP2002268658A (ja) 音声分析及び合成装置、方法、プログラム
JP2001034280A (ja) 電子メール受信装置および電子メールシステム
d’Alessandro et al. The speech conductor: gestural control of speech synthesis
JPS63199400A (ja) 音声合成装置
JP3233036B2 (ja) 歌唱音合成装置
JPS58168097A (ja) 音声合成装置
JPS5914752B2 (ja) 音声合成方式
JP3394281B2 (ja) 音声合成方式および規則合成装置
JPH0462600B2 (ja)
JPH09179576A (ja) 音声合成方法
JPH02293900A (ja) 音声合成装置
Lawlor A novel efficient algorithm for voice gender conversion
JPH03200300A (ja) 音声合成装置
JPS5977496A (ja) 音声セグメントのイントネ−シヨンを変化する方法及び装置
JPH0836397A (ja) 音声合成装置