JP2591289B2 - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JP2591289B2
JP2591289B2 JP2233505A JP23350590A JP2591289B2 JP 2591289 B2 JP2591289 B2 JP 2591289B2 JP 2233505 A JP2233505 A JP 2233505A JP 23350590 A JP23350590 A JP 23350590A JP 2591289 B2 JP2591289 B2 JP 2591289B2
Authority
JP
Japan
Prior art keywords
sound source
source signal
waveform
waveforms
cycle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2233505A
Other languages
English (en)
Other versions
JPH04113400A (ja
Inventor
謙二 松井
孝浩 釜井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2233505A priority Critical patent/JP2591289B2/ja
Publication of JPH04113400A publication Critical patent/JPH04113400A/ja
Application granted granted Critical
Publication of JP2591289B2 publication Critical patent/JP2591289B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Electrophonic Musical Instruments (AREA)

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、テキストを音声に変換する音声合成装置に
関する。
従来の技術 音声合成方式には現在色々な方式が考案されており、
たとえば、LPC系のパラメータを用いたLSP、PARCOR、ケ
プストラム方式や、ターミナルアナログ系のホルマント
合成方式等である。この中でホルマント合成方法は人間
の発声機構に対して物理的な対応が最も良く、古くから
用いられている方式である。
第8図は従来例のホルマント音声合成方式の構成を示
すものである。ここでは簡単のため母音の合成のみを考
える。同図に於て、10は音源波生成部、4は共振器や反
共振器からなるホルマント合成部である。まず、音源波
生成部10で所望の基本周波数の音源波を合成する。現在
用いられている音源波モデルは、第8図に示すように、
連続したパルス列、あるいは自然音源波をまねた形状の
ものが用いられている。この音源信号がホルマント合成
部4に入力され声道の共振特性を付与されて合成音とし
て出力される。
この手法では、上記のような音源信号で取り扱える音
源情報は非常に少なく、ある程度以上の自然性は望むこ
とが出来ない。自然な音源信号は、個人性、性別、年
齢、等の音声にとって非常に重要な情報を持っていると
言われている。然るに上記のような従来の音源モデルで
は重要な情報が大幅に欠陥し合成器からの出力が機械的
な音声になるのが実情である。そこで、これらの欠点を
解決するために人間の声帯で生起する音源信号を抽出
し、その一部を用いる方法が考えられている。この方法
は、先ず逆フィルタ法等で自然音声から声道の影響を取
り除き音源信号を抽出する。第9図は、この音源波形を
用いた合成用音源波生成の従来例を示したものである。
音源波形格納部1には予め自然音声の母音定常部などか
ら逆フィルタ法などにより声道の共振特性などを取り除
いた音源信号のうち連続したN周期波形(Nは任意の整
数)が格納されている。音声合成を行う場合、音源信号
生成部8が音源信号格納部1の音源信号を第10図示すよ
うに読み出しを連続して行い任意の長さの音源信号を生
成する。次に基本周波数制御部3で音源信号生成部8か
ら出力された音源波を所望の基本周波数に変換する。こ
の変換方法は例えばディジタル化されている音源信号の
各サンプル点間を線形補間することにより周期を変化さ
せる。第11図はこの線形補間の様子を示したものであ
る。基本周波数制御部3の出力は声道フィルタ部4に入
力される。ここでは声道フィルタ部4としてホルマント
合成方法を例にとって考える。第12図はホルマント合成
による声道フィルタ部4の信号処理の様子を示したもの
である。ここでは所望の音韻の各ホルマント周波数に対
応する共振器が音源信号のスペクトルを変化させ合成音
として出力させる。
第10図のAは単一周期の音源波形を繰り返して任意の
長さの音源波形とする方法である。また、Bは複数周期
の音源波形を繰り返して任意の長さの音源波形とする方
法である。これらの方法により前述の個人性、性別、年
齢、等の音声にとって非常に重要な情報はある程度合成
できるが、この手法の欠点としてAでは単一周期の繰り
返しのため音質が単調で機械的になると言う問題があ
る。また、Bでは複数周期波形の繰り返しのため最初の
部分と最後の部分を接続してループを作る時に周波数特
性的な差を生じる可能性がある。この場合、合成音には
雑音が含まれてしまう。また、自然音声では、発声が変
化する度に音源波形も変化するが、上記の方法ではこの
変化を表すことが出来ない。
発明が解決しようとする課題 本発明は上記のような従来例の欠点を鑑み、自然性の
高い合成音を出力できる技術を提供するものである。
課題を解決するための手段 本発明は、 (1)人間の声帯で生起する音源波形を抽出したものの
うち連続したN周期波形(Nは任意の整数)を格納する
音源信号格納部と、上記音源信号格納部の音源信号を波
形の最初の部分から1周期目、2周期目、と昇順に読み
出して行きN周期目の波形を読み出した後、降順にN−
1周期目、N−2周期目と読み出し、また1周期目に戻
った後は、再び昇順に読み出し任意の長さの音源信号を
生成する音源信号生成部と、上記音源信号生成部の出力
である音源信号の基本周波数を制御する基本周波数制御
部と、上記基本周波数制御部によって制御された音源信
号を入力とし人間の声道を模擬して音声信号を生成する
声道フィルタ部を具備するものである。
さらに、 (2)人間の声帯で生起する音源波形抽出したもののう
ち連続したN周期波形(Nは任意の整数)を格納する音
源信号格納部と、上記音源信号格納部の音源信号を1周
期目からN周期目までの間の任意の所で折り返しながら
任意の長さの音源信号を生成する音源信号生成部と、上
記音源信号生成部の出力である音源信号の基本周波数を
制御する基本周波数制御部と、上記基本周波数制御部に
よって制御された音源信号を入力とし人間の声道を模擬
して音声信号を生成する声道フィルタ部を具備するもの
である。
さらに、 (3)人間の声帯で生起する様々な音源波形の中でいく
つか特徴の異なる代表的な音源波形を抽出し、それぞれ
の波形を連続したN周期波形(Nは任意の整数)として
格納する音源信号格納部と、外部からの音韻情報や韻律
情報に基づいて上記音源信号格納部に格納されているい
くつかの音源波形のうち、最適なものを選択する音源波
形選択部を具備するものである。
さらに、 (4)2つの特徴の異なる音源波形を接続する際、2つ
の波形を時間的に同期させ、かつ伸縮により周期を等し
くしてから前の波形を徐々に減衰させ、かつ後ろの波形
を予め減衰させた状態から徐々に復元させつつ2つの波
形をたし合わせて接続する音源生成部を具備するもので
ある。
作 用 上記手段を用いることにより、自然音源の持つきめ細
かな情報を失う事無く音声合成処理が行え高品質な音声
が得られる。
実施例 第1図は、自然音源の持つきめ細かな情報を失う事な
く高品質な音声合成処理を行うことを目的とし、連続し
たN周期波形(Nは任意の整数)の音源波形テーブルを
双方向に読みだすことを特徴とする本発明の一実施例に
おける音声合成装置の構成を示すものである。
同図に於て、1は音源信号格納部、2は双方向読みだ
し音源信号生成部、3は基本周波数制御部、4は声道フ
ィルタ部である。
上記のように構成された本実施例の音声合成装置につ
いて以下その動作を説明する。ここでは簡単のため母音
の合成のみを考える。
音源信号格納部1には予め自然音声の母音定常部など
から逆フィルタ法などにより声道の共振特性などを取り
除いた音源信号のうち連続したN周期波形(Nは任意の
整数)が格納されている。音声合成を行う場合、双方向
読みだし音源信号生成部2が音源信号格納部1の音源信
号を先ず波形の最初の部分から1周期目,2周期目,と昇
順に読みだして行き最後の部分であるN周期目の波形を
読みだした後、降順にN−1周期目、N−2周期目と読
みだし、また1周期目に戻った後は、再び昇順に読みだ
す。以上の双方向の読みだしを連続して行い任意の長さ
の音源信号を生成する。この様子を第2図に示す。この
方法により任意の時点での連続した2つの音源信号の間
での波形の変化は常に滑らかである。これにより滑らか
な音源波が得られる。次に基本周波数制御部3で双方向
読みだし音源信号生成部2から出力された音源波を所望
の基本周波数に変換する。基本周波数制御部3の出力は
声道フィルタ部4に入力される。ここでは所望の音韻の
各ホルマント周波数に対応する共振器が音源信号のスペ
クトルを変化させ合成音として出力させる。
以上、説明したように本実施例によれば、自然音源を
効果的に利用し高品質な合成音を出力出来る。
次に、第3図を参照しながら、自然音源の持つきめ細
かな情報を失う事なく高品質な音声合成処理を行うこと
を目的とし、連続したN周期波形(Nは任意の整数)の
音源波形テーブルをランダムに折り返しながら読みだす
ことを特徴とする本発明第2の実施例における音声合成
装置を説明する。音源信号格納部1には予め自然音声の
母音定常部などから逆フィルタ法などにより声道の共振
特性などを取り除いた音源信号のうち連続したN周期波
形(Nは任意の整数)が格納されている。音声合成を行
う場合、ランダム折り返し読みだし音源信号生成部5が
音源信号格納部1の音源信号を先ず波形の最初の部分か
ら読みだして行きその都度2値の乱数を発生させて次に
昇順に読むか降順に読むかを決定する。この様子を第4
図に示す。この操作を連続して行い任意の長さの音源信
号を生成する。この方法により任意の時点での連続した
2つの音源波形の間での波形の変化は常に滑らかであ
り、かつランダムに折り返すことにより発生する波形の
揺らぎが合成音の自然さを増す。このランダム折り返し
読みだし音源信号生成部5から出力される音源波形は基
本周波数制御部3および声道フィルタ部4により所望の
合成音として出力される。
以上、説明したように本実施例によれば、ランダム折
り返しによる音源生成により自然音源を効果的に利用し
高品質な合成音を出力出来る。
次に、第5図を参照しながら音源波形の動的な特徴を
表すことを目的とする合成方式の一実施例について説明
する。
複数音源信号格納部6には予め自然音声のなかで多様
な特徴の異なる音声パターンを集め、これらから逆フィ
ルタ法などにより声道の共振特性を取り除いてそれぞれ
連続したN周期波形(Nは任意の整数)の音源信号パタ
ーンが格納されている。ここで、多様な特徴の異なる音
声パターンとは、例えば、声の強弱、声の質(ソフトな
声、硬い声)、母音の違い、語頭、語中、語尾の違い、
等である。これらの特徴の違いにより音源波形も異なっ
たものになる。
音声合成を行う場合、音源波形選択部7が外部からの
音韻情報や韻律情報に基づいて最適な音源パターンを選
択しそのパターン情報を音源信号生成部8に送る。音源
信号生成部8は任意の長さの音源信号を生成する。この
方法により音源波形の多様な変化を代表的なパターンに
より簡単に表現できより自然な音声合成が実現できる。
音源生成部8から出力される音源波形は基本周波数制御
部3および声道フィルタ部4により所望の合成音として
出力される。
以上、説明したように本実施例によれば、多様な音源
パターンを切り替えながら使用することにより自然音源
を効果的に利用し高品質な合成音を出力出来る。
次に、第6図を参照しながら特徴の異なる音源波形を
滑らかに接続し、より多様で自然な合成音を得ることを
目的とする合成方法の一実施例について説明する。
複数音源信号格納部6には予め自然音声のなかで多様
な特徴の異なる音声パターンを集め、これらから逆フィ
ルタ法などにより声道の共振特性を取り除いてそれぞれ
連続したN周期波形(Nは任意の整数)の音源信号パタ
ーンが格納されている。ここで、多様な特徴の異なる音
声パターンとは、例えば、声の強弱、声の質(ソフトな
声、硬い声)、母音の違い、語頭、語中、語尾の違い、
等である。これらの特徴の違いにより音源波形も異なっ
たものになる。
音声合成を行う場合、音源波形選択部7が外部からの
音韻情報や韻律情報に基づいて最適な音源パターンを選
択しそのパターン情報を音源信号生成部8に送る。音源
信号生成部8はある音源パターンについて任意の長さの
音源信号を生成する。音源接続部9は音源信号生成部8
から連続して出力される異なった音源波形パターンを第
7図に示すような方法で接続する。即ち、2つの波形を
時間的に同期させ、かつ線形伸縮などにより周期を等し
くしてから前の波形を徐々に減衰させ、かつ次の波形を
予め減衰させた状態から徐々に復元させつつ前と後ろの
波形をたし合わせて接続する。このように接続すること
により音源の特徴が急峻に変化することなくあるパター
ンから次のパターンに滑らかに移行できる。音源接続部
9から出力される音源波形は基本周波数制御部3および
声道フィルタ部4により所望の合成音として出力され
る。
以上、説明したように本実施例によれば、多様な音源
パターンを滑らかに切り替えながら使用することにより
自然音源を効果的に利用し高品質な合成音を出力出来
る。
発明の効果 本発明によれば、音源にパルスや単純なモデルでな
く、自然音声から取り出した音源波テーブルを双方向読
みだしや、ランダム折り返し読みだしによる音源波の生
成により滑らかで極めて自然性の高い合成音が得られ
る。
さらに、声の強弱、声の質(ソフトな声、硬い声)、
母音の違い、語頭、語中、語尾の違い、等の特徴の異な
る代表的な音源波形を切り替えながら使用することによ
り、より自然に近い合成音が得られる。
さらに、それらの特徴の異なる音源パターンを滑らか
に接続して使用できるので、多様な音質での高品質な合
成が実現できる。
【図面の簡単な説明】
第1図は本発明の第1実施例における音声合成装置のブ
ロック図、第2図は本実施例に於ける双方向読みだし音
源信号生成部の様子を示す図、第3図は本発明の第二の
実施例における音声合成装置のブロック図、第4図は本
実施例に於けるランダム折り返し読みだし音源信号生成
部の様子を示す図、第5図は本発明の第三の実施例にお
ける音声合成装置のブロック図、第6図は本発明の第四
の実施例における音声合成装置のブロック図、第7図は
本実施例に於ける音源波接続の様子を示す図、第8図は
従来の音声合成装置のブロック図、第9図は自然音源波
形を用いた従来の音声合成装置のブロック図、第10図は
本従来例に於ける音源信号生成部の様子を示す図、第11
図は本従来例における音源信号の基本周波数制御の様子
を示す図、第12図は声道フィルタ部の動作例を示す図で
ある。 1……音源信号格納部、2……双方向読みだし音源信号
生成部、3……基本周波数制御部、4……声道フィルタ
部、5……ランダム折り返し読みだし音源信号生成部、
6……複数音源信号格納部、7……音源波形選択部、8
……音源信号生成部、9……音源接続部、10……音源波
生成部。

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】人間の声帯で生起する音源波形を抽出した
    もののうち連続したN周期波形(Nは任意の整数)を格
    納する音源信号格納部と、上記音源信号格納部の音源信
    号を波形の最初の部分から1周期目、2周期目、と昇順
    に読み出して行きN周期目の波形を読み出した後、降順
    にN−1周期目、N−2周期目と読み出し、また1周期
    目に戻った後は、再び昇順に読み出し任意の長さの音源
    信号を生成する音源信号生成部と、上記音源信号生成部
    の出力である音源信号の基本周波数を制御する基本周波
    数制御部と、上記基本周波数制御部によって制御された
    音源信号を入力とし人間の声道を模擬して音声信号を生
    成する声道フィルタ部を具備することを特徴とする音声
    合成装置。
  2. 【請求項2】人間の声帯で生起する音源波形を抽出した
    もののうち連続したN周期波形(Nは任意の整数)を格
    納する音源信号格納部と、上記音源信号格納部の音源信
    号を1周期目からN周期目までの間の任意の所で折り返
    しながら任意の長さの音源信号を生成する音源信号生成
    部と、上記音源信号生成部の出力である音源信号の基本
    周波数を制御する基本周波数制御部と、上記基本周波数
    制御部によって制御された音源信号を入力とし人間の声
    道を模擬して音声信号を生成する声道フィルタ部を具備
    することを特徴とする音声合成装置。
  3. 【請求項3】人間の声帯で生起する様々な音源波形の中
    でいくつか特徴の異なる代表的な音源波形を抽出し、そ
    れぞれの波形を連続したN周期波形(Nは任意の整数)
    として格納する音源信号格納部と、外部からの音韻情報
    や韻律情報に基づいて上記音源信号格納部に格納されて
    いるいくつかの音源波形のうち、最適なものを選択する
    音源波形選択部を具備することを特徴とする請求項1ま
    たは請求項2に記載の音声合成装置。
  4. 【請求項4】2つの特徴の異なる音源波形を接続する
    際、2つの波形を時間的に同期させ、かつ伸縮により周
    期を等しくしてから前の波形を徐々に減衰させ、かつ後
    ろの波形を予め減衰させた状態から徐々に復元させつつ
    2つの波形をたし合わせて接続する音源生成部を具備す
    ることを特徴とする請求項3に記載の音声合成装置。
JP2233505A 1990-09-03 1990-09-03 音声合成装置 Expired - Lifetime JP2591289B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2233505A JP2591289B2 (ja) 1990-09-03 1990-09-03 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2233505A JP2591289B2 (ja) 1990-09-03 1990-09-03 音声合成装置

Publications (2)

Publication Number Publication Date
JPH04113400A JPH04113400A (ja) 1992-04-14
JP2591289B2 true JP2591289B2 (ja) 1997-03-19

Family

ID=16956081

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2233505A Expired - Lifetime JP2591289B2 (ja) 1990-09-03 1990-09-03 音声合成装置

Country Status (1)

Country Link
JP (1) JP2591289B2 (ja)

Also Published As

Publication number Publication date
JPH04113400A (ja) 1992-04-14

Similar Documents

Publication Publication Date Title
US4624012A (en) Method and apparatus for converting voice characteristics of synthesized speech
JP3673471B2 (ja) テキスト音声合成装置およびプログラム記録媒体
JP3732793B2 (ja) 音声合成方法、音声合成装置及び記録媒体
JP2564641B2 (ja) 音声合成装置
JP6474518B1 (ja) 簡易操作声質変換システム
JP2591289B2 (ja) 音声合成装置
JP5360489B2 (ja) 音素符号変換装置および音声合成装置
JP2001242882A (ja) 音声合成方法及び音声合成装置
WO2004027753A1 (en) Method of synthesis for a steady sound signal
JP3233036B2 (ja) 歌唱音合成装置
JP2005539261A (ja) 音声合成における時間幅を制御する方法
JP3081300B2 (ja) 残差駆動型音声合成装置
JP3394281B2 (ja) 音声合成方式および規則合成装置
JP6552146B1 (ja) 音声処理装置、および音声処理方法
JP7280605B2 (ja) 音声処理装置、および音声処理方法
JPS5914752B2 (ja) 音声合成方式
JP3994333B2 (ja) 音声辞書作成装置、音声辞書作成方法、及び、プログラム
JP2674280B2 (ja) 音声合成装置
JPH07152396A (ja) 音声合成装置
JP3284634B2 (ja) 規則音声合成装置
JPH0227397A (ja) 音声合成歌唱装置
JPH0836397A (ja) 音声合成装置
JP2001312300A (ja) 音声合成装置
JP2573585B2 (ja) 音声スペクトルパタン生成装置
JPH0962295A (ja) 音声素片作成方法および音声合成方法とその装置