JPH0514280B2 - - Google Patents

Info

Publication number
JPH0514280B2
JPH0514280B2 JP57177226A JP17722682A JPH0514280B2 JP H0514280 B2 JPH0514280 B2 JP H0514280B2 JP 57177226 A JP57177226 A JP 57177226A JP 17722682 A JP17722682 A JP 17722682A JP H0514280 B2 JPH0514280 B2 JP H0514280B2
Authority
JP
Japan
Prior art keywords
waveform
drive
residual signal
signal
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP57177226A
Other languages
English (en)
Other versions
JPS5965895A (ja
Inventor
Yasuhiko Arai
Masahisa Furuya
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP57177226A priority Critical patent/JPS5965895A/ja
Publication of JPS5965895A publication Critical patent/JPS5965895A/ja
Publication of JPH0514280B2 publication Critical patent/JPH0514280B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 産業上の利用分野 本発明は特定の駆動波形を用いる音声合成方法
に関するものである。
従来例の構成とその問題点 音声分析合成方式では、第1図a,bに示すよ
うに離散的な音声信号に一定長の窓関数、例えば
30ms長のハミング窓等を掛けて切り出した有限
個のデータから、音声のスペクトル情報を表現す
るスペクトルパラメータ(線形予測係数、パーコ
ール係数または線スペクトル対等)と、音源情報
を表現する音源パラメータ(振幅、ピツチ周期、
および有声無声判定)を分離して抽出し、この抽
出したパラメータを用いて元の音声信号を復元す
るようにしている。
上記スペクトルパラメータは、声道フイルタの
伝達特性を規定し、また上記音源パラメータは、
声道フイルタの駆動信号を規定するものである。
音声信号には、周期性のある有声音部分と、雑音
性の無声音部分があるが、有声無声判定パラメー
タは、声道フイルタの励振関数(駆動波形)を有
声音と無声音で切換えるためのものである。
通常、有声音を合成する時は、励振関数として
パルス波形や三角波形が用いられ、また無声音を
合成する時は、ランダムパルスが用いられてい
る。
スペクトルパラメータは、音声信号を声道逆フ
イルタに通して得られる残差信号のスペクトルが
白色化するように決定されるものである。また音
源パラメータとして、前記残差信号からエネルギ
ー計算によつて振幅が、また自已相関法によつて
周期性の有無(有声無声判定)およびピツチ周期
が抽出される。従つて音声を合成する時は、分析
の際に得られる残差信号に相当する駆動信号を音
源パラメータから作り出して声道フイルタに入力
すれば良い。この場合、有声音を合成する時の駆
動信号を一様スペクトル分布を有するパルス波形
を用い、その繰返し周期と振幅を制御して作り出
すのが一般的な方法である。これは、スペクトル
パラメータを抽出する際に、残差信号のスペクト
ルを白色化するようにしているため、合成の際に
も、白色スペクトルをもつ信号で駆動するのが理
想的であるという理由による。
しかしながら、実際の音声分析では、逆フイル
タの段数が8〜10段程度であり、また逆フイルタ
のモデルが必ずしも音声信号の生成モデルと合致
しないため、残差信号のスペクトルは必ずしも理
想的に白色化されるものではない。従つて、スペ
クトルパラメータでは表現しきれないスペクトル
情報が残差信号に含まれており、この残差信号を
パルスや三角波の繰返しでおきかえるところに合
成音声の品質を劣化させる1つの原因が存在す
る。
音声分析合成方式では、音声の生成モデル(合
成フイルタ)として全極形(AR)モデルを用い
ることが多い。ところが、実際にはこのARモデ
ルは十分に音声の生成モデルを近似している訳け
ではない。例えば、子音や鼻音の発生では、系は
極だけでなく零を有している。従つて、もつと精
密な(高品質の)合成を行なうためには極・零形
(AR・MA)モデルを導入することが望ましい。
ARモデルを用いた場合の合成フイルタのシス
テム関数HP(Z)は、 と表わされる。また、AR・MAモデルを用いた
場合のシステム関数HPZ(Z)は、 と表わされる。
第2図Aの曲線は、女性話者の音声信号を(1)式
の関数を用いて逆フイルタリングした出力信号
(残差信号)の長時間(約10秒)平均電力スペク
トルである。また、第3図A′の曲線は原声声信
号の長時間平均電力スペクトルである。Aと
A′では零点(およそ、600Hz,1400Hz,2200Hz,
3900Hz、および3500Hz附近に零点が観測される。
第2図、第3図において1〜5が零点)が良く一
致しており、零点は話者ごとに固定で良いことが
推察される。第2図Bの曲線は従来のパルス列に
よる駆動信号の長時間平均電力スペクトルであ
る。また、第3図B′は上記の駆動信号を用いて
合成した音声の長時間平均電力スペクトルであ
り、A′と比較して零点が不明瞭である。これは、
通常1式のNは、N=8〜10(第2,3図ではN
=10)で、この程度では充分に零点を近似しきれ
ないためである。
零点を付加する方法として、第4図に示すよう
に全極形の合成フイルタの前に全零形のフイルタ
を設ける方法が考えられる。全零形のフイルタの
システム関数をB(Z)とすると、第4図のm−
n間のシステム関数H(Z)は、 H(Z)=B(Z)・HP(Z) ……(3) となり、これは(2)式の極・零形モデルと等価にな
る。
第4図において、1は白色雑音源、2は周期的
インパルス源、3はスイツチ手段、4は増幅器、
5は全極形の合成フイルタ、6は全零形のフイル
タである。
ところで、零点の個数は第2図Aの場合5個で
あり、(2)式の次数Mは、M=10となる。一方、全
極形フイルタの次数Nも、N=10であり、極零形
モデルを用いることによつて演算処理はおよそ2
倍となり、装置化には極めて不利である。
発明の目的 本発明は上記従来の欠点を除去し、品質の良い
音声を合成することを目的とするものである。
発明の構成 本発明は、上記目的を達成するために、有声音
用駆動波形を、残差信号の平均電力スペクトルを
逆フーリエ変換して作り出すものであり、本発明
の音声合成方法によれば、固有の零点を持つた駆
動波形が簡単に得られ、また、この波形をメモリ
に格納して、ピツチ周期ごとに繰返し読み出せ
ば、合成フイルタに入力する連続した駆動信号が
得られる。波形記憶装置は32バイト〜64バイト程
度で良く、しかも、合成駆動波を導出する過程は
全て、ホストコンピユータで処理しておけば良い
ので、装置化の際になんらの障害もない。
実施例の説明 以下実施例について説明する。第5図で、A
は、第2図のAと同様の残差信号の平均電力スペ
クトルである。第5図のCはAを16点の折線で近
似した近似電力スペクトルである。第5図におけ
る近似電力スペクトルCを逆フーリエ変換すると
第6図の合成駆動波形が得られる。逆フーリエ変
換の際に位相情報を無視すると、対称な時間波形
が得られる。第6図の波形は、対称な時間波形を
回転シフトして、エネルギーの集中している部分
を前方時間軸の原点方向に移動させたものであ
る。
第6図の波形をメモリに格納し、ピツチ周期に
同期して読み出す際に、ピツチ周期が合成駆動波
よりも長い時は、0を補間し、短かい時は読み出
しを打切るようにしている。対称化された合成駆
動波を、そのまま使用すると、エネルギーが中央
に集中しているため、打切によつて波形が著しく
変形される危険性が多い。この危険性を低減する
ため、実施例では、合成駆動波を回転シフトして
エネルギーの集中している部分を前方に移動して
いる。
第7図は合成音声を7段階評定尺度法で評価し
た結果である。第7図において、10は上記実施
例による合成駆動波を用いて合成した場合、11
は残差信号から代表的な1ピツチ周期の波形を切
出して駆動波とした場合、12は従来のシングル
パルスを用いた場合である。本発明の実施例によ
る駆動波を用いて合成した場合が最も高く評価さ
れた。また、第8図は、第7図と同様の駆動波を
用いたそれぞれの駆動信号系列の平均電力スペク
トルと残差信号の平均電力スペクトルとの相異を
スペクトル距離尺度で評価した結果である。第8
図における20,21,22が第7図の10,1
1,12に対応するものである。本発明による駆
動波を用いた場合が最も残差信号に近いことがわ
かる。
発明の効果 以上のように本発明によれば、残差信号の長時
間平均電力スペクトルを折線で近似し、これを逆
フーリエ変換して得られる時間波形を駆動波形と
し、この駆動波形をピツチ周期ごとに繰返して読
み出すことにより、ピツチ周期程度に短い時間長
の駆動波形が得られ、時間軸上で駆動波形をピツ
チ周期ごとに接続することによつて連続した駆動
信号が簡単に生成できる。さらに、位相スペクト
ルを伝送する必要がなく、情報圧縮率が高いにも
かかわらず、合成音声のスペクトルが実音声スペ
クトルにきわめて近く、したがつて高品質の音声
を合成することができる。
【図面の簡単な説明】
第1図a,bは従来の音声分析合成方式の概略
図、第2図は残差信号およびパルス駆動信号の平
均スペクトルを示す図、第3図は原音声および合
成音声の平均スペクトルを示す図、第4図は全零
形フイルタを付加した音声合成方式の概略図、第
5図は本発明の一実施例における音声合方法にお
いて残差信号の平均電力スペクトルを16点の折線
で近似したスペクトルを示す図、第6図は第5図
における近似電力スペクトルを逆フーリエ変換し
て得た合成駆動波形を示す図、第7図は従来例お
よび本発明の音声合成方法における合成音声の評
価結果を示す図、第8図は従来例および本発明の
音声合成方法における駆動信号系列をスペクトル
尺度で評価した結果を示す図である。

Claims (1)

  1. 【特許請求の範囲】 1 音声信号を逆フイルタリングして得られる残
    差信号の長時間平均電力スペクトルを折線で近似
    し、これを逆フーリエ変換して得られる時間波形
    を駆動波形とし、この駆動波形をピツチ周期ごと
    に繰返して読み出すことを特徴とする音声合成方
    法。 2 残差信号の長時間平均電力スペクトルを折線
    で近似し、これを逆フーリエ変換して得られる時
    間波形を回転シフトして、エネルギーの集中して
    いる部分を時間軸の原点方向に移動させた波形を
    駆動波として用いることを特徴とする特許請求の
    範囲第1項記載の音声合成方法。
JP57177226A 1982-10-07 1982-10-07 音声合成方法 Granted JPS5965895A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57177226A JPS5965895A (ja) 1982-10-07 1982-10-07 音声合成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57177226A JPS5965895A (ja) 1982-10-07 1982-10-07 音声合成方法

Publications (2)

Publication Number Publication Date
JPS5965895A JPS5965895A (ja) 1984-04-14
JPH0514280B2 true JPH0514280B2 (ja) 1993-02-24

Family

ID=16027356

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57177226A Granted JPS5965895A (ja) 1982-10-07 1982-10-07 音声合成方法

Country Status (1)

Country Link
JP (1) JPS5965895A (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60260098A (ja) * 1984-06-06 1985-12-23 松下電器産業株式会社 音声合成用駆動信号生成方法
JPS61180299A (ja) * 1985-02-06 1986-08-12 日本電気株式会社 コ−デツク変換装置
JPS61259300A (ja) * 1985-05-14 1986-11-17 株式会社リコー 音声合成方式

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS554003A (en) * 1978-06-23 1980-01-12 Hitachi Ltd Sound analysis and synthetization
JPS5722297A (en) * 1980-07-15 1982-02-05 Matsushita Electric Works Ltd Voice synthesizing system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS554003A (en) * 1978-06-23 1980-01-12 Hitachi Ltd Sound analysis and synthetization
JPS5722297A (en) * 1980-07-15 1982-02-05 Matsushita Electric Works Ltd Voice synthesizing system

Also Published As

Publication number Publication date
JPS5965895A (ja) 1984-04-14

Similar Documents

Publication Publication Date Title
US9031834B2 (en) Speech enhancement techniques on the power spectrum
JP2787179B2 (ja) 音声合成システムの音声合成方法
Quatieri et al. Phase coherence in speech reconstruction for enhancement and coding applications
JP2000515992A (ja) 言語コーディング
JPH0514280B2 (ja)
JP2600384B2 (ja) 音声合成方法
JP2829978B2 (ja) 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
Acero Source-filter models for time-scale pitch-scale modification of speech
JPS6238500A (ja) 高能率音声符号化方式とその装置
JPS5961891A (ja) 残差信号符号化方法
JPS5888798A (ja) 音声合成方式
JPS6162100A (ja) マルチパルス型符号化復号化装置
JPS58162998A (ja) 音声合成方式
Fries Hybrid time-and frequency-domain speech synthesis with extended glottal source generation
Alcaraz Meseguer Speech analysis for automatic speech recognition
JPS62102294A (ja) 音声符号化方式
JP2629762B2 (ja) ピッチ抽出装置
Yim AutoRegressive Moving Average modelling in low bit rate speech coding
JPS61128299A (ja) 音声処理装置
JP2560277B2 (ja) 音声合成方式
JPH043876B2 (ja)
JPS60150100A (ja) 音声合成方法
JPS58162999A (ja) 音声合成用駆動波抽出方法
JPH0377999B2 (ja)
JPS6228800A (ja) 規則音声合成用駆動信号生成方法