JP3483891B2

JP3483891B2 - スピーチコーダ

Info

Publication number: JP3483891B2
Application number: JP50280997A
Authority: JP
Inventors: カーリヤルヴィーネン; テロホンカネン
Original assignee: Nokia Oyj
Current assignee: Nokia Oyj
Priority date: 1995-06-16
Filing date: 1996-06-13
Publication date: 2004-01-06
Anticipated expiration: 2016-06-13
Also published as: DE69615839D1; RU2181481C2; CN1652207A; JPH11507739A; BR9608479A; CN1192817A; US6029128A; EP0832482B1; ES2146155B1; DE69615839T2; AU6230996A; WO1997000516A1; CN1199151C; US5946651A; ATE206843T1; AU714752B2; ES2146155A1; EP0832482A1; GB9512284D0

Description

【発明の詳細な説明】発明の分野本発明は、圧縮されデジタルエンコードされた音声又
はスピーチ信号に使用するための音声又はスピーチ合成
器に係り、より詳細には、LPC型スピーチデコーダの励
起コードブック及び適応コードブックから導出された信
号を処理するための後処理装置に係る。

先行技術の説明デジタル無線電話システムにおいては、情報即ちスピ
ーチが空気中を経て送信される前にデジタルエンコード
される。エンコードされたスピーチは、次いで、受信器
においてデコードされる。先ず、アナログスピーチ信号
は、例えば、パルスコード変調（PCM）を用いてデジタ
ルエンコードされる。次いで、PCMスピーチ（又はオリ
ジナルスピーチ）のスピーチコード化及びデコード動作
がスピーチコーダ及びデコーダにより行われる。無線電
話システムの利用が増加しているために、このようなシ
ステムに使用できる無線スペクトルが混雑しつつある。
使用可能な無線スペクトルを最良に利用するために、無
線電話システムは、スピーチコード化技術を使用し、こ
れは、スピーチをエンコードするのに少数のビットしか
必要とせず、送信に必要な帯域巾を減少する。スピーチ
コード化に必要なビット数を減少して、スピーチ送信に
必要な帯域巾を更に減少するために、常に努力が払われ
ている。

既知のスピーチコード／デコード方法は、直線予想コ
ード化（LPC）技術をベースとするもので、分析−合成
励起コード化（analysis−by−synthesis excitation c
oding）を利用している。このような方法を用いたエン
コーダでは、スピーチサンプルが先ず分析され、そのス
ピーチサンプルの波形情報（LPC）のような特性を表す
パラメータが導出される。これらのパラメータは、短時
間合成フィルタへの入力として使用される。短時間合成
フィルタは、信号のコードブックから導出された信号に
より励起される。励起信号は、例えば、確率的コードブ
ックのようにランダムであってもよいし、或いはスピー
チコード化に使用するように適応又は特に最適化されて
もよい。典型的に、コードブックは、固定コードブック
と適応コードブックの２つの部分で構成される。各コー
ドブックの励起出力は合成され、そして全励起が短時間
合成フィルタに入力される。各全励起信号は、フィルタ
され、そしてその結果が、オリジナルのスピーチ信号
（PCMコード化された）と比較され、「エラー」即ち合
成されたスピーチサンプルとオリジナルのスピーチサン
プルとの間の差が導出される。最も小さなエラーを生じ
る全励起がスピーチサンプルを表すための励起として選
択される。固定及び適応コードブックの各部分最適励起
信号の位置についてのコードブック指示即ちアドレス
は、LPCパラメータ即ち係数と共に受信器へ送信され
る。送信器の場合と同じ複合コードブックが受信器にも
配置され、送信されたコードブック指示及びパラメータ
を用いて、受信器のコードブックから適当な全励起信号
が発生される。この全励起信号は、次いで、送信器と同
じ短時間合成フィルタに送られ、このフィルタは、送信
されたLPC係数を各入力として有する。この短時間合成
フィルタからの出力は、分析−合成方法により送信器に
おいて発生されたものと同じ合成されたスピーチフレー
ムである。

デジタルコード化の性質上、合成されたスピーチは、
客観的に正確であるが、人為的である。又、量子化の影
響や、電子的処理による他の異常により、質低下や歪や
欠陥が合成されたスピーチに導入される。このような欠
陥は、特にビットレートの低いコード化において生じ
る。というのは、オリジナルのスピーチ信号を正確に再
現するための情報が不十分だからである。従って、合成
スピーチの知覚し得る質を改善するための試みがなされ
ている。これは、合成スピーチサンプルに基づいて動作
して、その知覚し得る質を向上するための後置フィルタ
を使用することにより試みられる。既知の後置フィルタ
は、デコーダの出力に配置されて、合成スピーチを処理
し、スピーチの最も重要な周波数領域であると一般的に
考えられるものを強調又は減衰する。スピーチ周波数の
各領域の重要性は、主として、得られるスピーチ信号の
人間の耳に対する質についての主観的なテストを利用し
て分析される。スピーチは、２つの基本的な部分、即ち
スペクトル包絡線（フォルマント構造体）又はスペクト
ル高調波構造体（ライン構造体）に分割することがで
き、典型的に、後置フィルタは、スピーチ信号のこれら
の部分の一方又は他方或いはその両方を強調する。後置
フィルタのフィルタ係数は、スピーチ音声に一致するよ
うにスピーチ信号の特性に基づいて適応される。高調波
構造体を強調又は減衰するフィルタは、典型的に、長時
間又はピッチ（高さ）或いは長遅延の後置フィルタと称
され、そしてスペクトル包絡線構造体を強調するフィル
タは、典型的に、短遅延後置フィルタ又は短時間後置フ
ィルタと称される。

合成スピーチの知覚し得る質を改善するための更に別
の公知のフィルタ技術が国際特許出願WO91/06091号に開
示されている。このWO91/06091号には、通常スピーチ合
成又はLPCフィルタの後の位置に配置されるが、そのス
ピーチ合成又はLPCフィルタの前の位置に移動され、そ
のスピーチ合成又はLPCフィルタに入力される励起信号
に含まれたピッチ情報をフィルタするピッチ改善フィル
タより成るピッチ前置フィルタが開示されている。

しかしながら、知覚し得る質が更に優れた合成スピー
チを形成することが依然として要望される。

発明の要旨本発明の第１の特徴によれば、励起ソースから導出さ
れたスピーチ周期情報を含む第１信号に対して動作する
後処理手段を備え、この後処理手段は、励起ソースから
導出できる第２信号に基づいて第１信号のスピーチ周期
情報内容を変更するようなスピーチ合成のための合成器
が提供される。

本発明の第２の特徴によれば、合成スピーチを改善す
るための方法であって、励起ソースからスピーチ周期情
報を含む第１信号を導出し、励起ソースから第２信号を
導出し、そして第２信号に基づき第１信号のスピーチ周
期情報内容を変更するという段階を備えた方法が提供さ
れる。

本発明の効果は、第１信号が、第１信号と同じソース
から発生する第２信号により変更され、従って、余分な
フィルタのような付加的な歪又は欠陥のソースが導入さ
れないことである。励起ソースで発生される信号のみが
使用される。スピーチ合成器の励起発生器に固有の信号
の相対的な作用が、人為的な追加信号を伴わずに変更さ
れ、合成器の信号が再スケーリングされる。

励起の後処理が、スピーチ合成器自体の励起発生器内
で導入された励起成分の相対的な作用を変更することに
基づく場合には、良好なスピーチ改善を得ることができ
る。

励起発生器の固有の信号即ちｖ（ｎ）及びc_i（ｎ）の
相対的な作用を考慮又は変更せずに全励起ex（ｎ）をフ
ィルタすることにより励起を処理する場合には、一般
に、最良の改善が与えられない。同じ励起ソースからの
第２信号に基づいて第１信号を変更する場合は、励起及
びそれにより得られる合成スピーチ信号内の波形の連続
性が増加され、従って、知覚し得る質が改善される。

好ましい実施態様においては、励起ソースは、固定コ
ードブック及び適応コードブックを備え、第１信号は、
これら固定及び適応コードブックから各々選択できる第
１及び第２の部分励起信号の組合せから導出することが
でき、これは、スピーチ合成にとって特に便利な励起ソ
ースである。

好ましくは、励起ソースからの第１信号に関連したピ
ッチ情報から導出できる倍率（ｐ）に基づいて第２信号
をスケーリングするための利得素子が設けられ、これ
は、知覚し得るスピーチの質に対し他の変更よりも大き
な効果を奏する第１信号スピーチ周期情報内容が変更さ
れるという利点を有する。

倍率（ｐ）は、適応コードブック倍率（ｂ）から導出
でき、そして倍率（ｐ）は、次の式に基づいて導出でき
るのが適当である。

但し、THは、スレッシュホールド値を表し、ｂは、適応
コードブック利得係数であり、ｐは、後処理手段の倍率
であり、a_enhは、リニアスケーラであり、そしてｆ
（ｂ）は、利得ｂの関数である。

特定の実施形態では、倍率（ｐ）は、次の式に基づい
て導出できる。

ｂ＜TH_lowならば、ｐ＝0.0 TH_low≦ｂ≦TH_upperならば、ｐ＝a_enhb² ｂ＞TH_upperならば、ｐ＝a_enhb 但し、a_enhは、改善動作の強度を制御する定数であり、
ｂは、適応コードブック利得であり、THは、スレッシュ
ホールド値であり、そしてｐは、後処理手段の倍率で、
ｂが一般的に高い値を有する有声スピーチの場合にはス
ピーチ改善が最も有効であり、一方、ｂが低い値を有す
る無声音の場合にはあまり強力でない改善が要求される
という見識を利用するものである。

第２の信号は、適応コードブックから発生され、そし
て第２の部分励起信号と実質的に同じであってもよい。
或いは又、第２の信号は、固定コードブックから発生さ
れ、そして第１の部分励起信号と実質的に同じであって
もよい。

固定コードブックから発生される第２の信号の場合
に、利得制御手段は、第２の倍率（p'）に基づいて第２
の信号をスケーリングする。

p'＝−gp/（ｐ＋ｂ）但し、ｇは、固定コードブックの倍率であり、ｂは、適
応コードブックの倍率であり、そしてｐは、第１の倍率
である。

第１信号は、スピーチ合成フィルタに入力されるのに
適した第１励起信号であり、そして第２信号は、スピー
チ合成フィルタに入力されるのに適した第２励起信号で
ある。第２励起信号は、第２の部分励起信号と実質的に
同じである。

任意であるが、第１信号は、第１スピーチ合成フィル
タからの出力であって、第１励起信号から導出できる第
１合成スピーチ信号でよく、そして第２信号は、第２ス
ピーチ合成フィルタからの出力であって、第２励起信号
から導出できるものでよい。この場合の利点は、スピー
チ改善が実際の合成スピーチにおいて行われ、従って、
可聴となる前に信号に歪を導入する電子部品が少ないこ
とである。

変更された第１信号を次の関係に基づいてスケーリン
グするための適応エネルギー制御手段が設けられるのが
効果的である。

但し、Ｎは、適当に選択された適応周期であり、ex
（ｎ）は、第１の信号であり、ew'（ｎ）は、変更され
た第１信号であり、そしてｋは、エネルギー倍率で、得
られる改善された信号をスピーチ合成器への電力入力に
対して正規化するものである。

本発明の第３の特徴によれば、無線信号を受け取りそ
して無線信号に含まれたコード化情報を回復するための
高周波手段と、この高周波手段に接続され、上記コード
化情報に基づいてスピーチ周期情報を含む第１信号を発
生するための励起ソースとを備えた無線装置であって、
更に、励起ソースに作動的に接続されて、上記第１信号
を受け取り、そして上記第１信号のスピーチ周期情報内
容を励起ソースから導出された第２信号に基づいて変更
するための後処理手段と、この後処理手段からの変更さ
れた第１信号を受け取るように接続されて、それに応答
して合成スピーチを発生するためのスピーチ合成フィル
タとを備えた無線装置が提供される。

本発明の第４の特徴によれば、第１及び第２の励起信
号を各々発生するための第１及び第２の励起ソースと、
第１励起信号をその第１励起信号に関連したピッチ情報
から導出できる倍率に基づいて変更するための変更手段
とを備えたスピーチ合成のための合成器が提供される。

本発明の第５の特徴によれば、第１及び第２の励起信
号を各々発生するための第１及び第２の励起ソースと、
第２励起信号を第１励起信号に関連したピッチ情報から
導出できる倍率に基づいて変更するための変更手段とを
備えたスピーチ合成のための合成器が提供される。

本発明の第４及び第５の特徴は、好都合にも、励起発
生器自体の中で励起信号の倍率を統合する。

図面の簡単な説明以下、添付図面を参照し、本発明の好ましい実施形態
を詳細に説明する。

図１は、既知のコード励起直線予想（CELP）エンコー
ダの回路図である。

図２は、既知のCELPデコーダの回路図である。

図３は、本発明の第１の実施形態によるCELPデコーダ
の回路図である。

図４は、本発明の第２の実施形態を示す図である。

図５は、本発明の第３の実施形態を示す図である。

図６は、本発明の第４の実施形態を示す図である。

図７は、本発明の第５の実施形態を示す図である。

好ましい実施形態の詳細な説明既知のCELPエンコーダ100が図１に示されている。オ
リジナルのスピーチ信号は、102においてエンコーダに
入力され、そして適応コードブック104を用いて長時間
予想（LTP）係数Ｔ、ｂが決定される。このLTP予想係数
は、一般に40サンプルより成るスピーチのセグメントに
対して決定され、そして長さが5msである。LTP係数は、
オリジナルスピーチの周期的特徴に関連している。これ
は、オリジナルスピーチにおけるいかなる周期性も含
み、オリジナルスピーチを発音する人の声帯の振動によ
るオリジナルスピーチのピッチに対応する周期性だけで
はない。

長時間予想は、図１に点線で示された励起信号（ex
（ｎ））発生器126の一部分を構成する適応コードブッ
ク104及び利得素子114を用いて実行される。手前の励起
信号ex（ｎ）は、フィードバックループ122により適応
コードブック104に記憶される。LTPプロセス中に、適応
コードブックは、手前の励起信号ex（ｎ）を指す遅延即
ちラグとして知られているアドレスＴを変えることによ
りサーチされる。これらの信号は、順次に出力され、そ
して利得素子114において倍率ｂで増幅されて、信号ｖ
（ｎ）を形成し、この信号は、固定コードブック112か
ら導出されて利得素子116において倍率ｇでスケーリン
グされた励起信号c_i（ｎ）に118において加算される。
スピーチサンプルのための直線予想係数（LPC）が106に
おいて計算される。LPC係数は、次いで、108において量
子化される。量子化されたLPC係数は、次いで、空気中
を経て送信するように使用でき、短時間フィルタ110へ
入力される。LPC係数（ｒ（ｉ）、ｉ＝１・・・ｍ、但
し、ｍは予想順序）は、20msにわたり160サンプルより
成るスピーチのセグメントに対して計算される。それ以
上の全ての処理は、通常、40サンプルのセグメント、即
ち5msの励起フレーム長さで実行される。LPC係数は、オ
リジナルスピーチ信号のスペクトル包絡線に関連してい
る。

励起発生器126は、実際には、短時間合成フィルタ110
を励起するためのコードのセットを含む複合コードブッ
ク104、112を備えている。これらのコードは、スピーチ
フレームのスピーチサンプルに各々対応する電圧振幅の
シーケンスより成る。

各々の全励起信号ex（ｎ）は、短時間即ちLPC合成フ
ィルタ110に入力され、合成されたスピーチサンプルｓ
（ｎ）が形成される。この合成スピーチサンプルｓ
（ｎ）は、加算器120の負の入力に送られ、この加算器
は、オリジナルスピーチサンプルを正の入力として有す
る。加算器120は、オリジナルスピーチサンプルと合成
スピーチサンプルとの差を出力し、この差は、客観的エ
ラーとして知られている。この客観的エラーは、全励起
ex（ｎ）を選択する最良励起選択素子124へ入力され、
最小の客観的エラーを有する合成スピーチフレームｓ
（ｎ）が生じる。更に、選択中に、客観的エラーは、通
常、人間の知覚に対して重要なスピーチ信号のスペクト
ル領域を強調するためにスペクトル的に重み付けされ
る。次いで、最良の励起信号ex（ｎ）を与える各適応及
び固定コードブックパラメータ（利得ｂ及び遅延Ｔ、利
得ｇ及びインデックスｉ）が、LPCフィルタ係数ｒ
（ｉ）と共に受信器へ送られ、スピーチフレームの合成
に使用されて、オリジナルスピーチ信号を再構成する。

図１について述べたようにエンコーダにより発生され
たスピーチパラメータをデコードするのに適したデコー
ドが図２に示されている。高周波ユニット201は、アン
テナ212を経てコード化されたスピーチ信号を受け取
る。受け取った高周波信号は、RFユニット201において
基本帯域周波数にダウン変換されて復調され、スピーチ
情報が回復される。一般的に、コード化されたスピーチ
は、チャネルコード及びエラー修正コードを含むように
送信の前に更にエンコードされる。このチャンネルコー
ド及びエラー修正コードは、受信器においてデコードさ
れた後に、スピーチコードをアクセスし又は回復するこ
とができる。スピーチコードパラメータは、パラメータ
デコーダ202により回復される。

LPCスピーチコードのスピーチコードパラメータは、L
PC合成フィルタ係数ｒ（ｉ）;i＝１・・・ｍ（但し、ｍ
は予想の順序）、固定コードブックインデックスｉ及び
利得ｇのセットである。適応コードブックスピーチコー
ドパラメータ、即ち遅延Ｔ及び利得ｂも回復される。

スピーチデコーダ200は、上記スピーチコードパラメ
ータを使用して、励起発生器211から励起信号ex（ｎ）
を形成し、これは、LPC合成フィルタ208へ入力され、該
フィルタは、励起信号ex（ｎ）に対する応答として、合
成スピーチフレーム信号ｓ（ｎ）をその出力に与える。
合成スピーチフレーム信号ｓ（ｎ）は、音声処理ユニッ
ト209において更に処理されて、適当な音声トランスジ
ューサ210により聞こえるようにされる。

典型的な直線予想スピーチデコーダにおいては、LPC
合成フィルタ208の励起信号ex（ｎ）は、励起発生器211
において形成され、これは、励起シーケンスc_i（ｎ）を
発生する固定コードブック203と、適応コードブック204
とを備えている。各コードブック203、204におけるコー
ドブック励起シーケンスex（ｎ）の位置は、スピーチコ
ードパラメータｉ及び遅延Ｔによって指示される。励起
信号ex（ｎ）を形成するために部分的に使用される固定
コードブック励起シーケンスc_i（ｎ）は、インデックス
ｉで指示された固定励起コードブック203の位置から取
り出され、そしてスケーリングユニット205において送
信された利得係数ｇによって適当にスケーリングされ
る。同様に、励起信号ex（ｎ）を形成するために部分的
に使用される適応コードブック励起シーケンスｖ（ｎ）
も、適応コードブックに対して固有の選択ロジックを使
用して、遅延Ｔで示された適応コードブック204の位置
から取り出され、そしてスケーリングユニット206にお
いて送信された利得係数ｂにより適当にスケーリングさ
れる。

適応コードブック204は、固定コードブック励起シー
ケンスc_i（ｎ）に対して、第２の部分励起成分ｖ（ｎ）
をコードブック励起シーケンスgc_i（ｎ）に加算するこ
とにより動作する。第２の成分は、図１について既に述
べたように過去の励起信号から導出され、そして適応コ
ードブックに適当に含まれた選択ロジックを用いて適応
コードブック204から選択される。成分ｖ（ｎ）は、ス
ケーリングユニット206において送信された適応コード
ブック利得ｂにより適当にスケーリングされ、そして加
算器207においてgc_i（ｎ）に加算されて、全励起信号ex
（ｎ）を形成する。

ex（ｎ）＝gc_i（ｎ）＋bv（ｎ）（１）次いで、適応コードブック204は、この全励起信号ex
（ｎ）を用いて更新される。

適応コードブック204における第２の部分励起成分ｖ
（ｎ）の位置は、スピーチコードパラメータＴにより指
示される。適応励起成分は、スピーチコードパラメータ
Ｔ及び適応コードブックに含まれた選択ロジックを用い
て適応コードブックから選択される。

本発明によるLPCスピーチ合成デコーダ300が図３に示
されている。図３のスピーチ合成の動作は、図２と同じ
であるが、全励起信号ex（ｎ）は、LPC合成フィルタ208
のための励起信号として使用される前に、励起後処理ユ
ニット317において処理される。図３の回路素子201ない
し212の動作は、同じ番号をもつ図２の素子と同様であ
る。

本発明の特徴によれば、全励起信号ex（ｎ）のための
後処理ユニット317がスピーチデコーダ300に使用され
る。この後処理ユニット317は、第３の成分を全励起信
号ex（ｎ）に加算するための加算器313を備えている。
利得ユニット315は、得られる信号ew'（ｎ）を適当にス
ケーリングして、信号ew（ｎ）を形成し、これは、LPC
合成フィルタ208を励起するのに使用され、合成スピー
チ信号s_ew（ｎ）が形成される。本発明により合成され
るスピーチは、図２に示す公知のスピーチ合成でコーダ
により合成されるスピーチ信号ｓ（ｎ）に比して、知覚
し得る質を改善する。

後処理ユニット317は、これに全励起信号ex（ｎ）が
入力され、そして知覚的に改善された全励起信号ew
（ｎ）を出力する。又、後処理ユニット317は、適応コ
ードブック利得ｂと、スピーチコードパラメータによっ
て指示された適応コードブロック204の位置から取り出
されたまだスケーリングされていない部分励起成分ｖ
（ｎ）とを更に別の入力として有する。部分励起成分ｖ
（ｎ）は、第２の励起成分bv（ｎ）を形成するために励
起発生器211内に使用される同じ成分であるのが適当で
あり、この第２の励起成分は、スケーリングされたコー
ドブック励起信号gc_i（ｎ）に加算されて、全励起信号e
x（ｎ）を形成する。適応コードブック204から導出され
た励起シーケンスを使用することにより、余計なフィル
タを使用した既知の後置フィルタ又は前置フィルタの場
合のようにそれ以上の欠陥ソースがスピーチ処理電子回
路に追加されることはない。又、励起後処理ユニット31
7は、部分励起成分ｖ（ｎ）を倍率ｐでスケーリングす
るスケーリングユニット314も備え、そしてそのスケー
リングされた成分pv（ｎ）は、加算器313により全励起
成分ex（ｎ）に加算される。加算器313の出力は、中間
の全励起信号ew'（ｎ）である。これは、次の式で表さ
れる。

ew'（ｎ）＝gc_i（ｎ）＋bv（ｎ）＋pv（ｎ）＝gc_i（ｎ）＋（ｂ＋ｐ）ｖ（ｎ）（２）スケーリングユニット314の倍率ｐは、適応コードブ
ック利得ｂを用いて、知覚的改善利得制御ユニット312
において決定される。倍率ｐは、固定及び適応コードブ
ックからの２つの励起成分各々c_i（ｎ）及びｖ（ｎ）の
作用を再スケーリングする。この倍率ｐは、高い適応コ
ードブック利得値ｂを有する合成スピーチフレームサン
プルの間に倍率ｐが増加され、そして低い適応コードブ
ック利得値ｂを有するスピーチの間に倍率ｐが減少され
るように調整される。更に、ｂがスレッシュホールド値
より低い（ｂ＜TH_low）ときは、倍率ｐがゼロにセット
される。知覚的改善利得制御ユニット312は、以下の式
（３）に基づいて動作する。

ｂ＜TH_lowならば、ｐ＝0.0 TH_low≦ｂ≦TH_upperならば、ｐ＝a_enhb² （３）ｂ＞TH_upperならば、ｐ＝a_enhb 但し、a_enhは、改善動作の強度を制御する定数である。
本出願人は、a_enhの良好な値が0.25であり、そしてTH
_low及びTH_upperの良好な値が各々0.5及び1.0であること
が分かった。

上記式（３）は、より一般的な式であり、改善関数の
一般的な式は、以下の式（４）に示す。一般の場合に、
改善利得ｂに対し、３つ以上のスレッシュホールドがあ
る。又、利得は、ｂのより一般的な関数として定義する
ことができる。

上記の好ましい実施態様では、Ｎ＝２、TH_low＝0.5、TH
₂＝1.0、TH₃＝∞、a_enh1＝0.25、a_enh2＝0.25、f₁＝
（ｂ）b²、f₂（ｂ）＝ｂである。

スレッシュホールド値（TH）、改善値（a_enh）及び利
得関数（ｆ（ｂ））は、実験的に得られる。スピーチの
知覚的な質の唯一の現実的尺度は、人間がスピーチに傾
聴しそしてスピーチの質について主観的な見解を与える
ことにより得られるので、式（３）及び（４）に使用さ
れる値は、実験的に決定される。改善スレッシュホール
ド及び利得関数の種々の値が試みられ、最良に発音する
スピーチを生じるものが選択される。本出願人は、この
方法を使用してスピーチの質を改善することは、ｂが典
型的に高い値を有する場合の有声スピーチにとって特に
効果的であり、一方、低い値のｂを有する低有声の音に
対しては、あまり強力でない改善が要求されるという見
識を利用した。従って、利得値ｐは、歪が最も聞こえる
ような有声の音については、効果が強力であり、そして
無声の音については、効果が弱いか又は全く使用されな
いように制御される。従って、一般的なルールとして、
利得関数（f_n）は、ｂの大きな値については、ｂの小さ
な値よりも大きな効果が得られるように選択されねばな
らない。これは、スピーチのピッチ成分と他の成分との
間の差を増加する。

上記式（３）に基づいて動作する好ましい実施形態に
おいて、利得値ｂで作用する関数は、ｂの中間範囲の値
については平方依存性であり、そしてｂの大きな範囲の
値については線型依存性である。本出願人の現在の理解
では、これは良好なスピーチの質を与える。というの
は、ｂの大きな値、即ち高有声のスピーチの場合に大き
な効果があり、そしてｂの小さな値の場合に、あまり効
果がないからである。このため、ｂは一般に−１＜ｂ＜
１の範囲にあり、それ故、b²＜ｂである。

励起後処理ユニット317の入力信号ex（ｎ）と出力信
号ew（ｎ）との間に１の電力利得を確保するために、倍
率が計算され、そしてそれを用いて、スケーリングユニ
ット315において中間励起信号ew'（ｎ）をスケーリング
し、後処理された励起信号ew（ｎ）を形成する。倍率ｋ
は、次の式で与えられる。

但し、Ｎは、適当に選択された適応周期である。典型的
に、Ｎは、LPCスピーチコーデックの励起フレーム長さ
に等しくセットされる。

エンコーダの適応コードブックにおいて、フレーム長
さ又は励起長さより短いＴの値に対し、励起シーケンス
の一部分が未知である。これらの未知の部分について
は、適当な選択ロジックを用いることによって適応コー
ドブック内で置き換えシーケンスが局部的に発生され
る。この置き換えシーケンスを発生する多数の適応コー
ドブック技術が現在の技術から知られている。典型的
に、既知の励起の一部分のコピーが、未知の部分が位置
する場所にコピーされ、これにより、完全な励起シーケ
ンスが形成される。コピーされた部分は、得られるスピ
ーチ信号の質を改善するように何らかの仕方で適応する
ことができる。このようなコピーを行うときには、遅延
値Ｔは使用されない。というのは、それが未知の部分を
指すからである。むしろ、Ｔの変更値を生じる特定の選
択ロジックが使用される（例えば、常に既知の信号部分
を指すように整数の倍率でＴを乗算して使用する）。デ
コーダがエンコーダと同期されるように、デコーダの適
応コードブックに同様の変更が使用される。このような
選択ロジックを用いて適応コードブック内に置き換えシ
ーケンスを発生することにより、適応コードブックは、
女性や子供の音声のような高いピッチの音声に適応する
ことができ、これら音声に対し効率的な励起発生及び改
良されたスピーチの質を生じることができる。

良好な知覚的改善を得るために、例えば、フレーム長
さより短いＴの値に対し適応コードブックに固有の全て
の変更が改善後処理に考慮される。これは、本発明によ
れば、適応コードブックからの部分励起シーケンスｖ
（ｎ）を使用し、そしてスピーチ合成器の励起発生器に
対して固有の励起成分を再スケーリングすることにより
達成される。

要約すれば、この方法は、上記式（２）、（３）、
（４）、（５）に基づき、コードブック203及び適応コ
ードブック204から得られた部分励起成分の作用を適応
スケーリングすることにより、合成スピーチの知覚的な
質を向上すると共に、聞き取れる欠陥を減少する。

図４は、本発明の第２の実施形態を示すもので、励起
後処理ユニット417が図示のごとくLPC合成フィルタ208
の後に配置されている。この実施形態では、適応コード
ブック204から導出される第３の励起成分に対して、付
加的なLPC合成フィルタ408が必要とされる。図４におい
て、図２及び３と同じ機能を有する素子は、同じ参照番
号で示されている。

図４に示す第２の実施形態において、LPC合成スピー
チは、後処理手段417によって知覚的に改善される。コ
ードブック203及び適応コードブック204から導出される
全励起信号ex（ｎ）は、LPC合成フィルタ208へ入力さ
れ、そしてLPC係数ｒ（ｉ）に基づいて従来のやり方で
処理される。図３について述べたように適応コードブッ
ク204から導出される付加的な即ち第３の部分的励起成
分ｖ（ｎ）は、第２のLPC合成フィルタ408へスケーリン
グされずに入力され、そしてLPC係数ｒ（ｉ）に基づい
て処理される。各LPCフィルタ208、408の出力ｓ（ｎ）
及びs_v（ｎ）は、後置プロセッサ417へ入力され、そし
て加算器413で互いに加算される。信号s_v（ｎ）は、加
算器413に入力される前に、倍率ｐでスケーリングされ
る。図３について述べたように、処理倍率、即ち利得ｐ
の値は、実験的に得ることができる。更に、第３の部分
励起成分は、固定コードブック203から導出され、そし
てスケーリングされたスピーチ信号p's_v（ｎ）がスピー
チ信号ｓ（ｎ）から差し引かれてもよい。

それにより得られる知覚的に改善された出力s_w（ｎ）
は、次いで、音声処理ユニット209に入力される。

任意であるが、図４のスケーリングユニット414をLPC
合成フィルタ408の前に移動することにより改善システ
ムの更に別の変更を行うことができる。後処理手段417
をLPC又は短時間合成フィルタ208、408の後に配置する
と、スピーチ信号の強調性を良好に制御することができ
る。というのは、それが励起信号ではなく、スピーチ信
号に対して直接行われるからである。従って、あまり歪
が生じないことになる。

任意であるが、付加的な（第３の）励起成分が適応コ
ードブック204ではなくて固定コードブック203から導出
されるように図３及び４について各々述べた実施形態を
変更することにより改善を得ることができる。このとき
は、固定コードブックからの励起シーケンスc_i（ｎ）に
対する利得を減少するために、オリジナルの正の利得係
数ｐではなく、負の倍率を使用しなければならない。こ
れは、図３及び４の実施形態で得られるように、スピー
チ合成に対し部分励起信号c_i（ｎ）及びｖ（ｎ）の相対
的な作用の同様の変更を生じる。

図５は、倍率ｐ及び適応コードブックからの付加的な
励起成分を用いることにより得られたものと同じ結果を
得ることのできる本発明の別の実施形態を示す。この実
施形態では、固定コードブックの励起シーケンスc
_i（ｎ）がスケーリングユニット314に入力され、このユ
ニットは、知覚的改善利得制御器２（512）から出力さ
れる倍率p'に基づいて動作する。スケーリングユニット
314から出力されたスケーリングされた固定コードブッ
クの励起信号p'c_i（ｎ）は、加算器313に入力され、そ
こで、固定コードブック203及び適応コードブック204か
らの各成分c_i（ｎ）及びｖ（ｎ）より成る全励起シーケ
ンスex（ｎ）に加えられる。

適応コードブック204からの励起シーケンス信号ｖ
（ｎ）の利得を増加するときには、全励起（適応エネル
ギー制御器316の前の）が上記式（２）により与えられ
る。

ew'（ｎ）＝gc_i（ｎ）＋（ｂ＋ｐ）ｖ（ｎ）（２）固定コードブック203からの励起シーケンスc_i（ｎ）
の利得を減少するときには、全励起（適応エネルギー制
御器316の前の）が次の式で与えられる。

ew'（ｎ）＝（ｇ＋p'）c_i（ｎ）＋bv（ｎ）（６）但し、p'は、図５に示す知覚的改善利得制御器２（51
2）により導出される倍率である。式（２）を取り上げ
そして式（６）と同様の式へ再構成すると、次のように
なる。

従って、図５の実施形態において、 p'＝−gp/（ｐ＋ｂ）（８）を選択すると、図３の実施形態で得られたものと同様の
改善が得られる。中間の全励起信号ew'（ｎ）が適応エ
ネルギー制御器316によりex（ｎ）と同じエネルギー内
容までスケーリングされたときには、図３及び５の両方
の実施形態は、同じ全励起信号ew（ｎ）を生じる。

それ故、知覚的改善利得制御器２（512）は、図３及
び４の実施形態に関連して使用されたものと同じ処理を
使用して、「ｐ」を発生し、次いで、式（８）を用い
て、p'を得ることができる。

加算器313から出力された中間の全励起信号ew'（ｎ）
は、第１及び第２の実施形態について上記したのと同様
に、適応エネルギー制御器316の制御のもとでスケーリ
ングユニット315においてスケーリングされる。

図４を参照すれば、LPC合成スピーチは、後処理手段4
17により、固定コードブックからの付加的な励起信号か
ら導出された合成スピーチにより知覚的に改善される。

図４の点線420は、固定コードブックの励起信号c
_i（ｎ）がLPC合成フィルタ408に接続された実施形態を
示す。該LPC合成フィルタ408の出力（sc_i（ｎ））は、
次いで、ユニット414において、知覚的改善利得制御器5
12から導出された倍率p'に基づいてスケーリングされ、
そして加算器413において合成信号ｓ（ｎ）に加えら
れ、中間の合成信号s_w'（ｎ）が発生される。スケーリ
ングユニット415における正規化の後、得られた合成信
号s_w（ｎ）が音声処理ユニット209へ送られる。

上記の実施形態は、適応コードブック204又は固定コ
ードブック203から導出された成分を励起信号ex（ｎ）
又は合成信号ｓ（ｎ）に加算して、中間励起信号ew'
（ｎ）又は合成信号s_w'（ｎ）を形成することを含む。

任意であるが、後処理を排除し、そして適応コードブ
ックの励起信号ｖ（ｎ）又は固定コードブックの励起信
号c_i（ｎ）をスケーリングして互いに直接合成すること
もできる。これにより、スケーリングされていない合成
された固定及び適応コードブック信号に成分を加えるこ
とが回避される。

図６は、適応コードブックの励起信号ｖ（ｎ）がスケ
ーリングされそして固定コードブックの励起信号c
_i（ｎ）と合成されて、中間信号ew'（ｎ）を直接形成す
る本発明の実施形態を示す。

知覚的改善利得制御器612は、スケーリングユニット6
14を制御するためのパラメータ「ａ」を出力する。スケ
ーリングユニット614は、適応コードブックの励起信号
ｖ（ｎ）に対して動作し、通常の励起を得るのに使用さ
れる利得係数ｂにわたり励起信号ｖ（ｎ）をスケールア
ップ即ち増幅する。又、通常の励起信号ex（ｎ）も形成
され、適応コードブック204及び適応エネルギー制御器3
16へ接続される。加算器613は、このアップスケールさ
れた励起信号av（ｎ）と固定コードブックの励起信号c_i
（ｎ）とを合成し、次の中間信号を形成する。

ew'（ｎ）＝gc_i（ｎ）＋av（ｎ）（９）ａ＝ｂ＋ｐの場合には、式（２）によって与えられたも
のと同じ処理が達成される。

図７は、図６に示したものと同様の仕方で作用する
が、固定コードブックの励起信号c_i（ｎ）をダウンスケ
ーリング即ち減衰する実施形態を示す。この実施形態の
場合に、中間励起信号ew'（ｎ）は、次のように与えら
れる。

ew'（ｎ）＝（ｇ＋p'）c_i（ｎ）＋bv（ｎ）＝a'c_i（ｎ）＋bv（ｎ）（10）但し、 a'＝ｇ−gp/（ｐ＋ｂ）＝gb/（ｐ＋ｂ）（11）知覚的改善利得制御器712は、式（11）に基づいて制
御信号a'を出力して、式（８）に基づき式（６）で得た
のと同様の結果を得る。ダウンスケールされた固定コー
ドブックの励起信号a'c_i（ｎ）は、加算器713において
適応コードブックの励起信号ｖ（ｎ）と合成され、中間
励起信号ew'（ｎ）を形成する。他のプロセスは、前記
と同様に行われ、励起信号及び形成された合成信号s_ew
（ｎ）が正規化される。

図６及び７を参照して述べた実施形態は、励起信号を
励起発生器内でそしてコードブックから直接的にスケー
リングする。

図５、６及び７を参照して述べた実施形態に対する倍
率「ｐ」の決定は、上記式（３）又は（４）に基づいて
行われる。

改善レベル（a_enh）を制御する多数の方法を使用する
ことができる。適応コードブック利得ｂに加えて、改善
の程度は、適応コードブック204のラグ即ち遅れ値Ｔの
関数となる。例えば、後処理は、高ピッチの範囲で動作
するとき又は適応コードブックパラメータＴが励起ブロ
ック長さ（仮想遅れ範囲）より短いときにオン（又は強
調）にすることができる。その結果、本発明が最も有効
である女性及び子供の音声が高度に後処理される。

又、後処理制御は、有声／無声スピーチの判断をベー
スとすることもできる。例えば、改善は、音声スピーチ
に対して強くすることができ、そしてスピーチが無声と
分類されたときには完全にオフにすることができる。こ
れは、適応コードブック利得値ｂから導出することがで
き、この値それ自体は、有声／無声スピーチの簡単な尺
度であり、即ち、ｂが大きいと、より多くの有声スピー
チがオリジナルスピーチ信号に存在する。

本発明による実施形態は、第３の部分励起シーケンス
が、従来のスピーチ合成に基づいて適応コードブック又
は固定コードブックから導出される同じ部分励起シーケ
ンスではなく、別の第３の部分励起シーケンスを選択す
るために各コードブックに通常含まれる選択ロジックを
経て選択できるように変更されてもよい。第３の部分励
起シーケンスは、直前に使用された励起シーケンスであ
るように選択されてもよいし、又は常に固定コードブッ
クに記憶された同じ励起シーケンスであってもよい。こ
れは、スピーチフレーム間の相違を減少するように作用
し、従って、スピーチの継続性を向上させる。任意であ
るが、ｂ及び／又はＴは、デコーダにおいて合成スピー
チから再計算することができ、そしてそれを用いて、第
３の部分励起シーケンスを導出することができる。更
に、固定利得ｐ及び／又は固定励起シーケンスは、後処
理手段の位置に基づいて、全励起シーケンスex（ｎ）又
はスピーチ信号ｓ（ｎ）に適宜に加えたり差し引いたり
することができる。

以上の説明から、本発明の範囲内で種々の変更がなさ
れ得ることが当業者に明らかであろう。例えば、可変フ
レームレートのコード化、高速コードブックサーチ、及
びピッチ予想とLPC予想の順序の逆転をコーデックに使
用することができる。更に、本発明による後処理は、デ
コーダではなくエンコーダに含ませることもできる。更
に、添付図面を参照して述べた各実施形態の特徴を組み
合わせて本発明による更に別の実施形態を構成すること
もできる。

本明細書の開示の範囲は、請求の範囲に記載する発明
に関するものであるか、又は本発明が向けられた問題の
いずれか又は全てを軽減するものであるかを問わず、こ
こに記載した新規な特徴又は特徴の組合せ或いはその一
般性を包含する。従って、請求の範囲を逸脱せずになさ
れ得る全ての変更や修正は、本発明の範囲内に網羅され
るものとする。

フロントページの続き (72)発明者ホンカネンテロフィンランドエフイーエン−33720 タンペーレオピスケリーヤンカテュ 37ベー10 (56)参考文献特開昭60−150100（ＪＰ，Ａ) 特開平４−97199（ＪＰ，Ａ) 特開平５−108098（ＪＰ，Ａ) 特開平５−165497（ＪＰ，Ａ) 特開平５−315968（ＪＰ，Ａ) 特開平７−84598（ＪＰ，Ａ)

Claims

(57)【特許請求の範囲】

【請求項１】スピーチ周期情報を含み励起ソースから導
出される第１信号に対して動作する後処理手段を備え、
上記励起ソースは、固定コードブック及び適応コードブ
ックと、上記固定コードブック及び適応コードブックか
ら各々発信される第１及び第２の部分励起信号を組合わ
せることにより上記第１信号を得るための手段とを備え
ており、上記後処理手段は、上記固定コードブック又は
適応コードブックから導出できる第２信号に基づいて上
記第１信号のスピーチ周期情報内容を変更するように構
成されており、上記第１信号に関連したピッチ情報から
導出できる第１の倍率（ｐ）に基づいて上記第２信号を
スケーリングするための利得制御手段を備えることを特
徴とするスピーチ合成のための合成器。
【請求項２】上記第１の倍率（ｐ）は、適応コードブッ
クの倍率（ｂ）から導出できる請求項１に記載の合成
器。
【請求項３】上記第１の倍率（ｐ）は、次の関係式に基
づいて導出でき、但し、THはスレッシュホールド値を表し、ｂは適応コー
ドブック利得係数であり、ｐは第１の後処理手段の倍率
であり、a_enhはリニアスケーラでありそしてｆ（ｂ）は
利得ｂの関数である請求項２に記載の合成器。
【請求項４】上記倍率（ｐ）は、次の式に基づいて導出
でき、ｂ＜TH_lowならば、ｐ＝0.0 TH_low≦ｂ≦TH_upperならば、ｐ＝a_enhb² ｂ＞TH_upperならば、ｐ＝a_enhb 但し、a_enhは、改善動作の強度を制御する定数であり、
ｂは、適応コードブック利得であり、THは、スレッシュ
ホールド値であり、そしてｐは、第１の後処理手段の倍
率である請求項２又は３に記載の合成器。
【請求項５】上記第２信号は、適応コードブックから発
生される請求項１から４のうちのいずれかに記載の合成
器。
【請求項６】上記第２信号は、上記第２の部分励起信号
と実質的に同じである請求項５に記載の合成器。
【請求項７】上記第２信号は、固定コードブックから発
生される請求項１から４のうちのいずれかに記載の合成
器。
【請求項８】上記第２信号は、上記第１の部分励起信号
と実質的に同じである請求項７に記載の合成器。
【請求項９】上記利得制御手段は、第２の倍率（p'）に
基づいて上記第２の信号をスケーリングするように構成
され、 p'＝−gp/（ｐ＋ｂ）但し、ｇは、固定コードブックの倍率であり、ｂは、適
応コードブックの倍率であり、そしてｐは、第１の倍率
である請求項７又は８に記載の合成器。
【請求項１０】上記第１信号は、スピーチ合成フィルタ
に入力するのに適した第１励起信号であり、そして上記
第２信号は、スピーチ合成フィルタに入力するのに適し
た第２励起信号である請求項１ないし９のいずれかに記
載の合成器。
【請求項１１】上記第１信号は、第１スピーチ合成フィ
ルタから出力される第１合成スピーチ信号であり、そし
て上記第２信号は、第２スピーチ合成フィルタからの出
力である請求項１から９のうちのいずれかに記載の合成
器。
【請求項１２】上記利得制御手段は、第２スピーチ合成
フィルタに入力される信号に対して動作できる請求項11
に記載の合成器。
【請求項１３】第２信号と第１信号を合成することによ
り第１信号を変更する請求項１から12のうちのいずれか
に記載の合成器。
【請求項１４】上記後処理手段は、更に、変更された第
１信号を次の関係式、即ちに基づいてスケーリングするための適応エネルギー制御
手段を備え、但し、Ｎは適当に選択された適応周期であ
り、ex（ｎ）は第１信号であり、ew'（ｎ）は変更され
た第１信号であり、そしてｋはエネルギー倍率である請
求項13に記載の合成器。
【請求項１５】合成スピーチを改善するための方法にお
いて、固定コードブック及び適応コードブックからなる励起ソ
ースからスピーチ周期情報を含む第１信号を、上記固定
コードブック及び適応コードブックから各々発信される
第１及び第２の部分励起信号を組合わせることにより導
出し、上記固定コードブック又は適応コードブック励起ソース
から第２信号を導出し、上記第２信号に基づき第１信号のスピーチ周期情報内容
を変更し、その際に、上記第１信号に関連したピッチ情報から導出
される第１の倍率（ｐ）に基づいて上記第２信号をスケ
ーリングする、という段階を備えたことを特徴とする方法。
【請求項１６】第１の倍率（ｐ）は、第１信号のピッチ
情報に対する利得係数（ｂ）から導出できる請求項15に
記載の方法。
【請求項１７】上記第１の倍率（ｐ）は、次の関係式、
即ちに基づいて導出でき、但し、THはスレッシュホールド値
を表し、ｂは第１信号のピッチ情報の利得係数であり、
ｐは第１信号の倍率であり、ｐ＝a_enhはリニアスケーラ
でありそしてｆ（ｂ）はｂの関数である請求項16に記載
の方法。
【請求項１８】上記倍率（ｐ）は、ｂ＜TH_lowならば、ｐ＝0.0 TH_low≦ｂ≦TH_upperならば、ｐ＝a_enhb² ｂ＞TH_upperならば、ｐ＝a_enhb に基づいて導出でき、但し、a_enhは、改善動作の強度を
制御する定数であり、ｂは、第１信号のピッチ情報の利
得係数であり、THは、スレッシュホールド値であり、そ
してｐは、第２信号の倍率である請求項16又は17に記載
の方法。
【請求項１９】上記第２信号は、適応コードブックから
発生される請求項15から18のうちのいずれかに記載の方
法。
【請求項２０】上記第２信号は、上記第２の部分励起信
号と実質的に同じである請求項19に記載の方法。
【請求項２１】上記第２信号は、固定コードブックから
発生される請求項15から18のうちのいずれかに記載の方
法。
【請求項２２】上記第２信号は、上記第１の部分励起信
号と実質的に同じである請求項21に記載の方法。
【請求項２３】上記第２信号は、第２の倍率（p'）に基
づいてスケーリングされ、 p'＝−gp/（ｐ＋ｂ）但し、ｇは、固体コードブックの倍率であり、ｂは、適
応コードブックの倍率であり、そしてｐは、第１の倍率
である請求項21又は22に記載の方法。
【請求項２４】上記第１信号は、第１スピーチ合成フィ
ルタに入力するのに適した第１励起信号であり、そして
上記第２信号は、第２スピーチ合成フィルタに入力する
のに適した第２励起信号である請求項15から23のうちの
いずれかに記載の方法。
【請求項２５】上記第１信号は、第１スピーチ合成フィ
ルタから出力される第１合成スピーチ信号であり、そし
て上記第２信号は、第２スピーチ合成フィルタの出力で
ある請求項15から23のうちのいずれかに記載の方法。
【請求項２６】第２信号と第１信号を合成することによ
り第１信号を変更する請求項15から25のうちのいずれか
に記載の方法。
【請求項２７】変更された第１信号は、次の関係式に基
づいて正規化され、但し、Ｎは適当に選択された適応周期であり、ex（ｎ）
は第１信号であり、ew'（ｎ）は変更された第１信号で
あり、そしてｋはエネルギー倍率である請求項26に記載
の方法。
【請求項２８】無線信号を受け取りそして無線信号に含
まれたコード化情報を回復するための高周波手段と、上記高周波手段に接続される合成器とを備え、この合成
器は、スピーチ周期情報を含み励起ソースから導出され
る第１信号に対して動作する後処理手段を備え、上記励
起ソースは、固定コードブック及び適応コードブック
と、上記固定コードブック及び適応コードブックから各
々発信される第１及び第２の部分励起信号を組合わせる
ことにより上記第１信号を得るための手段とを備えてお
り、上記後処理手段は、上記固定コードブック又は適応
コードブックから導出できる第２信号に基づいて上記第
１信号のスピーチ周期情報内容を変更するように構成さ
れており、上記第１信号に関連したピッチ情報から導出
できる第１の倍率（ｐ）に基づいて上記第２信号をスケ
ーリングするための利得制御手段を備えており、更に、
上記後処理手段からの変更された第１信号を受け取るよ
うに接続されて、それに応答して合成スピーチを発生す
るためのスピーチ合成フィルタを含むことを特徴とする
無線装置。
【請求項２９】請求項１から14のうちのいずれかに記載
の合成器を備えた無線装置。
【請求項３０】請求項15から27のうちのいずれかに記載
の方法に基づいて合成スピーチを改善するように動作す
る無線装置。
【請求項３１】第１及び第２の部分励起信号をそれぞれ
発生するための適応コードブック及び固定コードブック
と、受信した適応および固定コードブック倍率で上記第
１及び第２の部分励起信号をそれぞれスケーリングする
ためのスケーリングユニット手段と、上記第１の部分励
起信号に関連したピッチ情報の関数である別の倍率にし
たがって上記第１の部分励起信号を変更するための変更
手段と、上記第２の部分励起信号を上記変更された第１
の部分励起信号と組合わせるための手段とを備えたこと
を特徴とするスピーチ合成のための合成器。
【請求項３２】第１及び第２の部分励起信号をそれぞれ
発生するための適応コードブック及び固定コードブック
と、受信した適応および固定コードブック倍率で上記第
１及び第２の部分励起信号をそれぞれスケーリングする
ためのスケーリングユニット手段と、上記第１の部分励
起信号に関連したピッチ情報の関数である別の倍率にし
たがって上記第２の部分励起信号を変更するための変更
手段と、上記変更された第２の部分励起信号を上記第１
の部分励起信号と組合わせるための手段とを備えたこと
を特徴とするスピーチ合成のための合成器。