JPS5965895A - 音声合成方法 - Google Patents

音声合成方法

Info

Publication number
JPS5965895A
JPS5965895A JP57177226A JP17722682A JPS5965895A JP S5965895 A JPS5965895 A JP S5965895A JP 57177226 A JP57177226 A JP 57177226A JP 17722682 A JP17722682 A JP 17722682A JP S5965895 A JPS5965895 A JP S5965895A
Authority
JP
Japan
Prior art keywords
waveform
speech
synthesis method
vector
residual signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP57177226A
Other languages
English (en)
Other versions
JPH0514280B2 (ja
Inventor
新居 康彦
古屋 正久
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP57177226A priority Critical patent/JPS5965895A/ja
Publication of JPS5965895A publication Critical patent/JPS5965895A/ja
Publication of JPH0514280B2 publication Critical patent/JPH0514280B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は特定の駆動波形を用いる音声合成方法に関する
ものである、。
従来例の構成とその問題点 音声分析合成方式では、第1図a、bに示すように離散
的な音声信号に一定長の窓関数、例えば30m5長の7
・ミンク窓等を掛けて切り出した有限個のデータから、
音声のスペクトル情報を表現するスペクトルパラメータ
(線形予測係数、〕〕ζ−コーし係数また(は線スペク
トル対等)と、音源情報を表現する音源パラメータ(振
幅、ピッチ周期。
および有声無声判定)を分離して抽出し、この抽出した
パラメータを用いて元の音声信号を復元するよう(こシ
ている。
上記スペクトルパラメータは、声道フィルタの伝達特性
を規定し、また上記音源パラメータは、声道フィルタの
1駆動信号を規定するものである。
音声信号((は、周期性のある有声音部分と、雑音性の
無声音部分かあるか、有声無声判定・々ラメータは、声
道フィルタの励振関数(1駆動波形)を有声音と無声音
で切換えるためのものである。
通常、有声音を合成する時は、励振関数としてパルス波
形や三角波形が用いられ、また無声音を合成する時は、
ランダムノ(ルスが用いられている。
スペクトルパラメータは、音声信号を声道逆)ィルタに
通して得られる残差信号のスペクトルか白色化するよう
に決定されるものである。また音源パラメータとして、
前記残差信号からエネルギー計算によって振幅か、まだ
自己相関法Vこよって周期性の有無(有声無声判定)お
よびピッチ周期が抽出される。従って音声を合成−しる
時は、分析の際に得られる残差信号に相当する。駆動信
号を音源パラメータから作り出して声道フィルタに入力
すれば良い。この場合、有声音を合成する時○駆動信号
を一様スベクトル分布を有するパルス波形を用い、その
繰返し周期と振幅を制御して作り出すのが一般的力方法
である。これは、スペクトルパラメータを抽出する際に
、残差信号のスペクトルを白色化するようにしているた
め、合成の際にも、白色スペクトルをもつ信号で1駆動
するのが理想的であるという理由による。
しかしながら、実際の音声分析では、逆フィルタの段数
が8〜10段程度であり、また逆フィルタのモデルが必
ずしも音声信号の生成モテルと合致し々いため、残差信
号のスペクトルは必ずしも理想的Qこ白色化きれるもの
ではない。従って、スペクトルパラメータでは表現しき
れないスペクトル情報が残差信号に含丑れており、この
残差信号をパルースや三角波の繰返しておきかえるとこ
ろに合成音声の品質全劣化させる1つの原因か存在する
音声分析合成方式ては、音声の生成モテル(合成フィル
タ)として全極形(AR)モデルを用いることか多い。
ところか、実際にはこのARモモデ(は十分に音声の生
成モテルを近似している訳けて(riな−5゜例えは、
子音や鼻音の発生で1/li、系は夕たけてなく零を有
している。従って、もっと精密な(高品質の)合成を行
なうために一二極・塔形(AR,MA)モデルを導入す
ることか望寸しい9ARモデルを用いた場合の合成フィ
ルタのシステム関数HP(Z)は、 と表わされる。丑だ、AR−MAモモデを用いた場合の
システム関数Hpz(Z) は、第2図Aの曲線は、女
性話者の音声信号を(1)式の関数を用いて逆フィルタ
リングした出力信号(残差信号)の長時間(約10秒)
平均型カスベクトルである。寸だ、第3図A′の曲線は
原声声f8号の長時間平均型カスベクトルであるuAと
A′では零点(およそ、600Hz 、1400H2。
2200Hz、3900Hz 、および3500 Hz
附近に零点か観測される。第2図、第3図において1〜
5が零点)が良く一致しており、零点は話者ごとに固定
で良いことか推察される。第2図Bの曲線は従来のパル
ス列による駆動信号の長時間平均型カスベクトルである
。また、第3図B′は上記の駆動信号を用いて合成した
音声の長時間平均電カスベクトルであ’)、Atと比較
して零点が不明瞭である。これは、通常1式のN(d、
N二8〜10(第2,3図ではN、=’10)で、この
程度では充分に零点を近似しきれないためである。
零屯を付加する方法として、第4図に示すように全極形
の合成フィルタ9前に全零形のフィルタを設ける方法が
考えられる。全零形のフィルりのシステム関数をB(Z
)とすると、第4図のm −n間のシステム関数H(Z
)iI″i、 H(Z)−B(Z)−Hp (Z)       ・・
=(3)となり、これ−は(4式の極・塔形モデルと等
価になる。
第41スにおいて、1は白色雑音源、2は周期的インパ
ルス源、3はスイッチ手段、4は増幅器、5(/i全極
形の合成フィルタ、6は全零形のフィルりである。
ところで、零Jの個数は第2図への場合5個であり、(
噂弐の次数Mは、M−10となる。一方、全極形フィル
タの次数Nも、N=10であり、極零形モデルを用いる
ことによって演算処理(はおよそ2培となり、装置化に
は極めて不利である。
発明の目的 本発明は上記従来の欠点を除去し、品質の良い音声を合
成することを目的とするものである。。
発明の構成 本発明は、」二側目的を達成するためVこ、有声音用駆
動波形を、残差信号の平均型カスベクトルを逆フーリエ
変換して作り出すものであり、本発明の音声合成方法に
よれば、固有の零点を持った、駆動波形が簡単に得られ
、寸だ、この波形をメモリに格納して、ピッチ周期して
繰返し読み出せば、合成フィルタに入力する連続した1
駆動係号か得られる。波形記憶装置は32バイト〜64
 /<イl−程度で良く、しかも、合成1駆動波を導出
する過程は全テ、ホストコンピュータで処理しておけは
良いので、装置化の際になんらの障害もない。
実施例の説明 以下実施例について説明する。第5図で、Aば、第2図
のAと同様の残差信号の平均型カスベクトルである。第
2図のCはAを16点の折線で近似した近似電カスベク
トルである。第2図における近似電カスベクトルCを逆
フーリエ変換すると第6図の合成駆動波形が得られる。
逆フーリエ変換の際に位相情報を無視すると、対称な時
間波形が喝られる。第6図の波形は1、対称な時間波形
を回転/フトl〜で、エネルギーの集中している部分を
前方時間軸の原点方向に移動させたものである。
第6図の波形をメモリに格納し、ピ・ソチ周期に同期し
て読み出す際に、ピッチ周期か合成駆動波よりも長い時
は、0を補間し、短かい時は読み出しを打切るようにし
ている。対称化さ、れた合成、駆動波を、その1斗使用
すると、エネルギーか中央υτ集甲しているため、打切
によって波形が著しく変形される危険1牛か多い。この
危険性を低減するため、実施例では、合成、駆動波を回
転シフトシてエネルギーの集中している部分を前方に移
動している。
第7図は合成音声を7段階評定尺度°法で評価した結果
である。第7図において、10は上記実施例による合成
、駆動波を用いて合成した場合、11は残差信号から代
表的な1ピ、チ周期の波形を切出して駆動波とした場合
、12は従来のシングルパルスを用いた場合である。本
発明の実施例による駆動波を用いて合成した場合が最も
高く評価された。また、第8図は、第7図と同様の1駆
動波を用いたそれぞれの駆動信号系列の平均型カスベク
トルと残差信号の平均型カスベクトルとの相異をスペク
トル距離尺度で評価した結果である。第8図における2
0,2“1,22が第71図の10.1112に対応す
るものである。本発明による5駆動波を用いた場合が最
も残差信号に近いことかわかる。
発明の効果 以上のように本発明によれば、残差信号の長時間型カス
ベクトルを折線で近似し、これを逆フーリエ変換して得
られる時間波形を、駆動波形として使用しているため、
合成音声のスペクトルが実音声スペクトルに極め1近く
、従って高品質の音声が合成できる利点がある。また、
合成駆動′波を導出する過程は全てホストコンピュータ
で処理すればよいへめ、装置側の負担が軽微で済む利点
がある、。
【図面の簡単な説明】
第11・a、bは従来の音声分析合成方式の概略図、第
2図は残差信号およびパルス、駆動信号の平均スペクト
ルを示す図、第3図は原音声および合成置市の平均スペ
クトルを示す図、第4図は全零形フィルタを付加した音
声合成方式の概略図、第5図は本発明の一実施例におけ
る音声合方法において残、差信号の平均型カスベクトル
を16点の折線で近似したスペクトルを示す図、第6図
は第6図における近イυ′淑カスベクトルを逆フーリエ
変換して署、り合成、駆動波形を示す図、第7図は従来
例およ1つ・4り発明のi?声合成方法におけ−る合成
音声の評価結果を示す図、第8図は従来例およO・本発
明の音声合成方法:二おける4駆動係号系列をスペクト
ル尺度てW゛ト価た結果を示す図である。 イヘ゛理人のん石 モチし  宇4岳り男1シン゛房第
1図 ピ、ケ  4f1博、P  J屋訃苗       j
4ルグ+31大、T¥I浪ノK    ″ 第3図 朋慎教   ”″ 第 4 図 第5図 686− 第613 標木4−号

Claims (1)

    【特許請求の範囲】
  1. (1)  音声信号を逆フィルタリングして得られる残
    差信号の長時間平均電カスベクトルを逆フーリエ変換し
    て得られる時間波形を駆動波として用いることを特徴と
    する音声合成方法。 (坤 残差信号の長時間平均電カスベクトルを逆フーリ
    エ変換して得られる時間波形を回転ノット[2て、エネ
    ルギーの集中している部分を時間軸0原点方向に移動さ
    せた波形を駆動波として用いることを特徴とする特許請
    求の範囲第1項記載の音声合成方法。
JP57177226A 1982-10-07 1982-10-07 音声合成方法 Granted JPS5965895A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57177226A JPS5965895A (ja) 1982-10-07 1982-10-07 音声合成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57177226A JPS5965895A (ja) 1982-10-07 1982-10-07 音声合成方法

Publications (2)

Publication Number Publication Date
JPS5965895A true JPS5965895A (ja) 1984-04-14
JPH0514280B2 JPH0514280B2 (ja) 1993-02-24

Family

ID=16027356

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57177226A Granted JPS5965895A (ja) 1982-10-07 1982-10-07 音声合成方法

Country Status (1)

Country Link
JP (1) JPS5965895A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60260098A (ja) * 1984-06-06 1985-12-23 松下電器産業株式会社 音声合成用駆動信号生成方法
JPS61180299A (ja) * 1985-02-06 1986-08-12 日本電気株式会社 コ−デツク変換装置
JPS61259300A (ja) * 1985-05-14 1986-11-17 株式会社リコー 音声合成方式

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS554003A (en) * 1978-06-23 1980-01-12 Hitachi Ltd Sound analysis and synthetization
JPS5722297A (en) * 1980-07-15 1982-02-05 Matsushita Electric Works Ltd Voice synthesizing system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS554003A (en) * 1978-06-23 1980-01-12 Hitachi Ltd Sound analysis and synthetization
JPS5722297A (en) * 1980-07-15 1982-02-05 Matsushita Electric Works Ltd Voice synthesizing system

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60260098A (ja) * 1984-06-06 1985-12-23 松下電器産業株式会社 音声合成用駆動信号生成方法
JPS61180299A (ja) * 1985-02-06 1986-08-12 日本電気株式会社 コ−デツク変換装置
JPH052159B2 (ja) * 1985-02-06 1993-01-11 Nippon Electric Co
JPS61259300A (ja) * 1985-05-14 1986-11-17 株式会社リコー 音声合成方式

Also Published As

Publication number Publication date
JPH0514280B2 (ja) 1993-02-24

Similar Documents

Publication Publication Date Title
US9031834B2 (en) Speech enhancement techniques on the power spectrum
Schroeder Vocoders: Analysis and synthesis of speech
JP3294604B2 (ja) 波形の加算重畳による音声合成のための処理装置
JP2763322B2 (ja) 音声処理方法
US8706496B2 (en) Audio signal transforming by utilizing a computational cost function
Moulines et al. Time-domain and frequency-domain techniques for prosodic modification of speech
RU2296377C2 (ru) Способ анализа и синтеза речи
JP3732793B2 (ja) 音声合成方法、音声合成装置及び記録媒体
JP2000515992A (ja) 言語コーディング
JP2904279B2 (ja) 音声合成方法および装置
JPS5965895A (ja) 音声合成方法
Acero Source-filter models for time-scale pitch-scale modification of speech
JP2005523478A (ja) 音声を合成する方法
JPS62102294A (ja) 音声符号化方式
JPS5888798A (ja) 音声合成方式
JP3394281B2 (ja) 音声合成方式および規則合成装置
JPS58162998A (ja) 音声合成方式
JPS5961891A (ja) 残差信号符号化方法
JPS5914752B2 (ja) 音声合成方式
JP2629762B2 (ja) ピッチ抽出装置
JPS58162999A (ja) 音声合成用駆動波抽出方法
CN114974271A (zh) 一种基于声道滤波和声门激励的语音重构方法
JPS6228800A (ja) 規則音声合成用駆動信号生成方法
JP2580123B2 (ja) 音声合成装置
JPH0258640B2 (ja)