JPS5965895A

JPS5965895A - 音声合成方法

Info

Publication number: JPS5965895A
Application number: JP57177226A
Authority: JP
Inventors: 新居　康彦; 古屋　正久
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1982-10-07
Filing date: 1982-10-07
Publication date: 1984-04-14
Also published as: JPH0514280B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】産業上の利用分野本発明は特定の駆動波形を用いる音声合成方法に関する
ものである、。

従来例の構成とその問題点音声分析合成方式では、第１図ａ、ｂに示すように離散
的な音声信号に一定長の窓関数、例えば３０ｍ５長の７
・ミンク窓等を掛けて切り出した有限個のデータから、
音声のスペクトル情報を表現するスペクトルパラメータ
（線形予測係数、〕〕ζ−コーし係数また（は線スペク
トル対等）と、音源情報を表現する音源パラメータ（振
幅、ピッチ周期。

および有声無声判定）を分離して抽出し、この抽出した
パラメータを用いて元の音声信号を復元するよう（こシ
ている。

上記スペクトルパラメータは、声道フィルタの伝達特性
を規定し、また上記音源パラメータは、声道フィルタの
１駆動信号を規定するものである。

音声信号（（は、周期性のある有声音部分と、雑音性の
無声音部分かあるか、有声無声判定・々ラメータは、声
道フィルタの励振関数（１駆動波形）を有声音と無声音
で切換えるためのものである。

通常、有声音を合成する時は、励振関数としてパルス波
形や三角波形が用いられ、また無声音を合成する時は、
ランダムノ（ルスが用いられている。

スペクトルパラメータは、音声信号を声道逆）ィルタに
通して得られる残差信号のスペクトルか白色化するよう
に決定されるものである。また音源パラメータとして、
前記残差信号からエネルギー計算によって振幅か、まだ
自己相関法Ｖこよって周期性の有無（有声無声判定）お
よびピッチ周期が抽出される。従って音声を合成−しる
時は、分析の際に得られる残差信号に相当する。駆動信
号を音源パラメータから作り出して声道フィルタに入力
すれば良い。この場合、有声音を合成する時○駆動信号
を一様スベクトル分布を有するパルス波形を用い、その
繰返し周期と振幅を制御して作り出すのが一般的力方法
である。これは、スペクトルパラメータを抽出する際に
、残差信号のスペクトルを白色化するようにしているた
め、合成の際にも、白色スペクトルをもつ信号で１駆動
するのが理想的であるという理由による。

しかしながら、実際の音声分析では、逆フィルタの段数
が８〜１０段程度であり、また逆フィルタのモデルが必
ずしも音声信号の生成モテルと合致し々いため、残差信
号のスペクトルは必ずしも理想的Ｑこ白色化きれるもの
ではない。従って、スペクトルパラメータでは表現しき
れないスペクトル情報が残差信号に含丑れており、この
残差信号をパルースや三角波の繰返しておきかえるとこ
ろに合成音声の品質全劣化させる１つの原因か存在する
。

音声分析合成方式ては、音声の生成モテル（合成フィル
タ）として全極形（ＡＲ）モデルを用いることか多い。

ところか、実際にはこのＡＲモモデ（は十分に音声の生
成モテルを近似している訳けて（ｒｉな−５゜例えは、
子音や鼻音の発生で１／ｌｉ、系は夕たけてなく零を有
している。従って、もっと精密な（高品質の）合成を行
なうために一二極・塔形（ＡＲ，ＭＡ）モデルを導入す
ることか望寸しい９ＡＲモデルを用いた場合の合成フィ
ルタのシステム関数ＨＰ（Ｚ）は、と表わされる。丑だ、ＡＲ−ＭＡモモデを用いた場合の
システム関数Ｈｐｚ（Ｚ）　は、第２図Ａの曲線は、女
性話者の音声信号を（１）式の関数を用いて逆フィルタ
リングした出力信号（残差信号）の長時間（約１０秒）
平均型カスベクトルである。寸だ、第３図Ａ′の曲線は
原声声ｆ８号の長時間平均型カスベクトルであるｕＡと
Ａ′では零点（およそ、６００Ｈｚ　、１４００Ｈ２。

２２００Ｈｚ、３９００Ｈｚ　、および３５００　Ｈｚ
附近に零点か観測される。第２図、第３図において１〜
５が零点）が良く一致しており、零点は話者ごとに固定
で良いことか推察される。第２図Ｂの曲線は従来のパル
ス列による駆動信号の長時間平均型カスベクトルである
。また、第３図Ｂ′は上記の駆動信号を用いて合成した
音声の長時間平均電カスベクトルであ’）、Ａｔと比較
して零点が不明瞭である。これは、通常１式のＮ（ｄ、
Ｎ二８〜１０（第２，３図ではＮ、＝’１０）で、この
程度では充分に零点を近似しきれないためである。

零屯を付加する方法として、第４図に示すように全極形
の合成フィルタ９前に全零形のフィルタを設ける方法が
考えられる。全零形のフィルりのシステム関数をＢ（Ｚ
）とすると、第４図のｍ　−ｎ間のシステム関数Ｈ（Ｚ
）ｉＩ″ｉ、Ｈ（Ｚ）−Ｂ（Ｚ）−Ｈｐ　（Ｚ）　　　　　　　・・
＝（３）となり、これ−は（４式の極・塔形モデルと等
価になる。

第４１スにおいて、１は白色雑音源、２は周期的インパ
ルス源、３はスイッチ手段、４は増幅器、５（／ｉ全極
形の合成フィルタ、６は全零形のフィルりである。

ところで、零Ｊの個数は第２図への場合５個であり、（
噂弐の次数Ｍは、Ｍ−１０となる。一方、全極形フィル
タの次数Ｎも、Ｎ＝１０であり、極零形モデルを用いる
ことによって演算処理（はおよそ２培となり、装置化に
は極めて不利である。

発明の目的本発明は上記従来の欠点を除去し、品質の良い音声を合
成することを目的とするものである。。

発明の構成本発明は、」二側目的を達成するためＶこ、有声音用駆
動波形を、残差信号の平均型カスベクトルを逆フーリエ
変換して作り出すものであり、本発明の音声合成方法に
よれば、固有の零点を持った、駆動波形が簡単に得られ
、寸だ、この波形をメモリに格納して、ピッチ周期して
繰返し読み出せば、合成フィルタに入力する連続した１
駆動係号か得られる。波形記憶装置は３２バイト〜６４
　／＜イｌ−程度で良く、しかも、合成１駆動波を導出
する過程は全テ、ホストコンピュータで処理しておけは
良いので、装置化の際になんらの障害もない。

実施例の説明以下実施例について説明する。第５図で、Ａば、第２図
のＡと同様の残差信号の平均型カスベクトルである。第
２図のＣはＡを１６点の折線で近似した近似電カスベク
トルである。第２図における近似電カスベクトルＣを逆
フーリエ変換すると第６図の合成駆動波形が得られる。

逆フーリエ変換の際に位相情報を無視すると、対称な時
間波形が喝られる。第６図の波形は１、対称な時間波形
を回転／フトｌ〜で、エネルギーの集中している部分を
前方時間軸の原点方向に移動させたものである。

第６図の波形をメモリに格納し、ピ・ソチ周期に同期し
て読み出す際に、ピッチ周期か合成駆動波よりも長い時
は、０を補間し、短かい時は読み出しを打切るようにし
ている。対称化さ、れた合成、駆動波を、その１斗使用
すると、エネルギーか中央υτ集甲しているため、打切
によって波形が著しく変形される危険１牛か多い。この
危険性を低減するため、実施例では、合成、駆動波を回
転シフトシてエネルギーの集中している部分を前方に移
動している。

第７図は合成音声を７段階評定尺度°法で評価した結果
である。第７図において、１０は上記実施例による合成
、駆動波を用いて合成した場合、１１は残差信号から代
表的な１ピ、チ周期の波形を切出して駆動波とした場合
、１２は従来のシングルパルスを用いた場合である。本
発明の実施例による駆動波を用いて合成した場合が最も
高く評価された。また、第８図は、第７図と同様の１駆
動波を用いたそれぞれの駆動信号系列の平均型カスベク
トルと残差信号の平均型カスベクトルとの相異をスペク
トル距離尺度で評価した結果である。第８図における２
０，２“１，２２が第７１図の１０．１１１２に対応す
るものである。本発明による５駆動波を用いた場合が最
も残差信号に近いことかわかる。

発明の効果以上のように本発明によれば、残差信号の長時間型カス
ベクトルを折線で近似し、これを逆フーリエ変換して得
られる時間波形を、駆動波形として使用しているため、
合成音声のスペクトルが実音声スペクトルに極め１近く
、従って高品質の音声が合成できる利点がある。また、
合成駆動′波を導出する過程は全てホストコンピュータ
で処理すればよいへめ、装置側の負担が軽微で済む利点
がある、。

【図面の簡単な説明】

第１１・ａ、ｂは従来の音声分析合成方式の概略図、第
２図は残差信号およびパルス、駆動信号の平均スペクト
ルを示す図、第３図は原音声および合成置市の平均スペ
クトルを示す図、第４図は全零形フィルタを付加した音
声合成方式の概略図、第５図は本発明の一実施例におけ
る音声合方法において残、差信号の平均型カスベクトル
を１６点の折線で近似したスペクトルを示す図、第６図
は第６図における近イυ′淑カスベクトルを逆フーリエ
変換して署、り合成、駆動波形を示す図、第７図は従来
例およ１つ・４り発明のｉ？声合成方法におけ−る合成
音声の評価結果を示す図、第８図は従来例およＯ・本発
明の音声合成方法：二おける４駆動係号系列をスペクト
ル尺度てＷ゛ト価た結果を示す図である。イヘ゛理人のん石　モチし　　宇４岳り男１シン゛房第
１図ピ、ケ　　４ｆ１博、Ｐ　　Ｊ屋訃苗　　　　　　　ｊ
４ルグ＋３１大、Ｔ￥Ｉ浪ノＫ　　　　″ 第３図朋慎教　　　”″ 第　４　図第５図６８６− 第６１３標木４−号

Claims

【特許請求の範囲】

（１）　　音声信号を逆フィルタリングして得られる残
差信号の長時間平均電カスベクトルを逆フーリエ変換し
て得られる時間波形を駆動波として用いることを特徴と
する音声合成方法。（坤　残差信号の長時間平均電カスベクトルを逆フーリ
エ変換して得られる時間波形を回転ノット［２て、エネ
ルギーの集中している部分を時間軸０原点方向に移動さ
せた波形を駆動波として用いることを特徴とする特許請
求の範囲第１項記載の音声合成方法。