JP2535809B2 - 線形予測型音声分析合成装置 - Google Patents
線形予測型音声分析合成装置Info
- Publication number
- JP2535809B2 JP2535809B2 JP60096223A JP9622385A JP2535809B2 JP 2535809 B2 JP2535809 B2 JP 2535809B2 JP 60096223 A JP60096223 A JP 60096223A JP 9622385 A JP9622385 A JP 9622385A JP 2535809 B2 JP2535809 B2 JP 2535809B2
- Authority
- JP
- Japan
- Prior art keywords
- synthesis
- analysis
- power
- pitch
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000003786 synthesis reaction Methods 0.000 title claims description 51
- 230000015572 biosynthetic process Effects 0.000 title claims description 50
- 230000006870 function Effects 0.000 description 6
- 238000000034 method Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Description
【発明の詳細な説明】 (産業上の利用分野) 本発明は音声分析合成装置に関し、特に音声合成フィ
ルタの出力波形に対して利得調整を施す手段を有する音
声分析合成装置の動作振幅範囲の拡大を図った音声分析
合成装置に関する。
ルタの出力波形に対して利得調整を施す手段を有する音
声分析合成装置の動作振幅範囲の拡大を図った音声分析
合成装置に関する。
(従来の技術) 音声分析合成装置は分析側で音声を分析して特徴パラ
メータを抽出し、合成側で前記パラメータを再合成する
ものであり、通常、装置規模が比較的小さい固定小数点
による有限精度演算を利用する音声合成フィルタを備え
て音声波形を合成している。このような分析合成装置に
よる音声合成にあっては、合成される音声波形の品質を
高品位のものに保持するためには不十分となり勝な音声
合成フィルタのダイナミックレンジ,S/N(Signal to No
ise)比を補足する目的から音声合成フィルタの入力側
ではなく出力側で入力音声の音源の強さに対応した利得
調整を行なっている。
メータを抽出し、合成側で前記パラメータを再合成する
ものであり、通常、装置規模が比較的小さい固定小数点
による有限精度演算を利用する音声合成フィルタを備え
て音声波形を合成している。このような分析合成装置に
よる音声合成にあっては、合成される音声波形の品質を
高品位のものに保持するためには不十分となり勝な音声
合成フィルタのダイナミックレンジ,S/N(Signal to No
ise)比を補足する目的から音声合成フィルタの入力側
ではなく出力側で入力音声の音源の強さに対応した利得
調整を行なっている。
しかしながら従来のこの種の音声合成手段には次の如
き更に改善すべき問題点がある。
き更に改善すべき問題点がある。
すならち、音声合成フィルタはそのスペクトル伝送特
性が音声の発声者の声道伝送特性と対応づけられるもの
であり、被分析音声波形のスペクトル筒絡形状の変化に
伴ないそのフィルタ係数も時々変化するものである。従
って音声合成フィルタはそのフィルタ利得、即ち入力信
号の電力と出力信号の電力との比も時々刻々変化する。
そのため従来の音声合成フィルタの出力波形に対して利
得調整を施す手段を有する音声分析合成装置では、経験
的に知られる合成フィルタの最大利得を勘案して音声合
成フィルタの入力信号レベルを一定にしている。従って
合成フィルタの利得が小さい場合には音声合成フィルタ
の出力波形レベルが相対的に小さくなり、本発明の目的
である音声合成フィルタのダイナミックレンジ、S/N比
の補足が充分に達成されないという問題がある。
性が音声の発声者の声道伝送特性と対応づけられるもの
であり、被分析音声波形のスペクトル筒絡形状の変化に
伴ないそのフィルタ係数も時々変化するものである。従
って音声合成フィルタはそのフィルタ利得、即ち入力信
号の電力と出力信号の電力との比も時々刻々変化する。
そのため従来の音声合成フィルタの出力波形に対して利
得調整を施す手段を有する音声分析合成装置では、経験
的に知られる合成フィルタの最大利得を勘案して音声合
成フィルタの入力信号レベルを一定にしている。従って
合成フィルタの利得が小さい場合には音声合成フィルタ
の出力波形レベルが相対的に小さくなり、本発明の目的
である音声合成フィルタのダイナミックレンジ、S/N比
の補足が充分に達成されないという問題がある。
本発明の目的も上述した欠点を除去し、音声合成フィ
ルタのダイナミックレンジ、S/N比の補足を充分に達成
し得る音声分析合成装置を提供することにある。
ルタのダイナミックレンジ、S/N比の補足を充分に達成
し得る音声分析合成装置を提供することにある。
本発明の装置は、音声合成フィルタの出力波形に対し
て利得調整を施す機能を有し、且つ正規化予測残差電力
を算出する手段を合成側に有して構成される。
て利得調整を施す機能を有し、且つ正規化予測残差電力
を算出する手段を合成側に有して構成される。
次に図面を参照して本発明を詳細に説明する。
第1図は本発明による音声分析合成装置の一実施例の
構成を示すブロック図である。
構成を示すブロック図である。
第1図に示す実施例は分析側1と合成側2とから成
り、さらに分析側1は窓処理器11,LPC分析器12,ピッチ
抽出器13,電力算出器14,K量子化器15,ピッチ量子化器1
6,電力量子化器17,マルチプレクサ18を備えて構成さ
れ、また合成側2は、デマルチプレクサ19,K復号化器2
0,ピッチ復号化器21,電力復号化器22,正規化予測残差電
力算出器23,1/2乗器(1)24,掛算器(1)25,K/α変換
器26,LPC合成フィルタ27,掛算器(2)28,ピッチパルス
発声器29,雑音発声器30,切換器31,1/2乗器(2)32を備
えて構成される。
り、さらに分析側1は窓処理器11,LPC分析器12,ピッチ
抽出器13,電力算出器14,K量子化器15,ピッチ量子化器1
6,電力量子化器17,マルチプレクサ18を備えて構成さ
れ、また合成側2は、デマルチプレクサ19,K復号化器2
0,ピッチ復号化器21,電力復号化器22,正規化予測残差電
力算出器23,1/2乗器(1)24,掛算器(1)25,K/α変換
器26,LPC合成フィルタ27,掛算器(2)28,ピッチパルス
発声器29,雑音発声器30,切換器31,1/2乗器(2)32を備
えて構成される。
第1図において、入力ライン1001を介して入力した入
力音声信号は窓処理器11によって窓処理を受ける。この
窓処理は次のようにして実施される。
力音声信号は窓処理器11によって窓処理を受ける。この
窓処理は次のようにして実施される。
窓処理器11は入力音声信号を低域フィルタリングした
のちA/D(Analog to Digital)コンバータによって所定
のビット数での量子化を実施する。
のちA/D(Analog to Digital)コンバータによって所定
のビット数での量子化を実施する。
本実施例の場合、低域フィルタリングは遮断周波数3.
4KHzのLPF(Low Pass Filter)を通してこの周波数以上
の周波数成分をカットし、そのあと8MHzのサンプリング
周波数で標本化したものを1サンプル当り12ビットで量
子化したうえ一旦内部メモリにストアする。この内部メ
モリは入力する量子化信号を予め設定する時間分たとえ
ば30mSEC分すなわち240サンプルの窓時間分を記憶しこ
れにハミング関数あるいは矩形関数等の窓関数を乗算し
て切出す窓処理を所定の周期,本実施例では10mSEC周期
で実施しこれが分析フレーム周期となる。
4KHzのLPF(Low Pass Filter)を通してこの周波数以上
の周波数成分をカットし、そのあと8MHzのサンプリング
周波数で標本化したものを1サンプル当り12ビットで量
子化したうえ一旦内部メモリにストアする。この内部メ
モリは入力する量子化信号を予め設定する時間分たとえ
ば30mSEC分すなわち240サンプルの窓時間分を記憶しこ
れにハミング関数あるいは矩形関数等の窓関数を乗算し
て切出す窓処理を所定の周期,本実施例では10mSEC周期
で実施しこれが分析フレーム周期となる。
このようにして窓処理器11から出力される分析フレー
ムごとの量子化音声信号はLPC分析器12,ピッチ抽出器13
と電力算出器14と供給される。
ムごとの量子化音声信号はLPC分析器12,ピッチ抽出器13
と電力算出器14と供給される。
LPC分析器12は入力した分析フレームごとの量子化音
声信号をLPC分析し所定の次数のLPC,本実施例では10次
のKパラメータ(部分自己相関係数)を抽出しK量子化
器15へ出力する。K量子化器15は供給されたKパラメー
タを所定のビット数に量子化しマルチプレクサ18へ出力
する。ピッチ抽出器13は公知の方法により入力した分析
フレームごとの量子化音声信号の音声/無声を判定し、
更にピッチ周期を抽出しピッチ量子化器16へ出力する。
ピッチ量子化器16は供給された有声/無声判別結果とピ
ッチ周期情報を一括して所定のビット数に量子化しマル
チプレクサ18へ出力する。電力算出器14は入力した分析
フレームごとの量子化音声信号の電力を算出し電力量子
化器17へ出力する。電力量子化器17は供給された電力情
報を所定のビット数に量子化しマルチプレクサ18へ出力
する。
声信号をLPC分析し所定の次数のLPC,本実施例では10次
のKパラメータ(部分自己相関係数)を抽出しK量子化
器15へ出力する。K量子化器15は供給されたKパラメー
タを所定のビット数に量子化しマルチプレクサ18へ出力
する。ピッチ抽出器13は公知の方法により入力した分析
フレームごとの量子化音声信号の音声/無声を判定し、
更にピッチ周期を抽出しピッチ量子化器16へ出力する。
ピッチ量子化器16は供給された有声/無声判別結果とピ
ッチ周期情報を一括して所定のビット数に量子化しマル
チプレクサ18へ出力する。電力算出器14は入力した分析
フレームごとの量子化音声信号の電力を算出し電力量子
化器17へ出力する。電力量子化器17は供給された電力情
報を所定のビット数に量子化しマルチプレクサ18へ出力
する。
マルチプレクサ18はこうして供給を受けた入力を所定
の形式で多重化したうえ伝送路101を介して合成側2に
伝送する。
の形式で多重化したうえ伝送路101を介して合成側2に
伝送する。
合成側2ではデマルチプレクサ19によって入力の多重
化分離を行ない、LPC符号はK復号化器20に、ピッチ情
報(有声/無声判別情報を含む)はピッチ復号化器21
に、電力情報は電力復号化器22にそれぞれ供給され復号
化される。
化分離を行ない、LPC符号はK復号化器20に、ピッチ情
報(有声/無声判別情報を含む)はピッチ復号化器21
に、電力情報は電力復号化器22にそれぞれ供給され復号
化される。
K復号化器20は復号化したKパラメータをK/α変換器
26と正規化予測残差算出器23とへ出力する。正規化予測
残差電力算出器23は下記(1)式により正規化予測残差
電力Uを算出する。
26と正規化予測残差算出器23とへ出力する。正規化予測
残差電力算出器23は下記(1)式により正規化予測残差
電力Uを算出する。
(1)式に於いてKp(p=1.2……10)はKパラメー
タである。正規化予測残差電力算出器23に算出したUを
1/2乗器(1)24へ出力する。1/2乗器(1)24はテーブ
ルバックアップ法により を算出し掛算器(1)25へ出力する。
タである。正規化予測残差電力算出器23に算出したUを
1/2乗器(1)24へ出力する。1/2乗器(1)24はテーブ
ルバックアップ法により を算出し掛算器(1)25へ出力する。
K/α変換器26は公知の手法を用いてKパラメータから
αパラメータ(α1,α2……α10)を算出しLPC合成フ
ィルタ27へ出力する。
αパラメータ(α1,α2……α10)を算出しLPC合成フ
ィルタ27へ出力する。
1/2乗器(2)32は電力復号化器22より供給される電
力情報Pよりテーブルルックアップ法により を求めた掛算器(2)28へ出力する。
力情報Pよりテーブルルックアップ法により を求めた掛算器(2)28へ出力する。
ピッチ復号化器21は復号したピッチ周期情報をピッチ
パルス発声器29へ、有声/無声判別情報を切換器31へ出
力する。ピッチパルス発声器29はピッチ周期情報と一致
する周期を有するピッチパルス列を発声し切換器31へ出
力する。雑音発声器30は例えば15次のM系列等を用いて
白色雑音を発声し切換器31へ出力する。切換器31は有声
/無声情報に基づいて、有声時にはピッチパルス列を無
声時には白色雑音を選択して掛算器(1)25へ供給す
る。掛算器(1)25は前記 を用いてピッチパルス列又は白色雑音の振幅を 倍しLPC合成フィルタ27へ出力する。LPC合成フィルタ27
はK/α変換器26より供給されるαパラメータをフィルタ
係数とし、掛算器(1)25より供給される されたピッチパルス列又は白色雑音を入力として音声を
合成(掛算器(2)28へ出力する。
パルス発声器29へ、有声/無声判別情報を切換器31へ出
力する。ピッチパルス発声器29はピッチ周期情報と一致
する周期を有するピッチパルス列を発声し切換器31へ出
力する。雑音発声器30は例えば15次のM系列等を用いて
白色雑音を発声し切換器31へ出力する。切換器31は有声
/無声情報に基づいて、有声時にはピッチパルス列を無
声時には白色雑音を選択して掛算器(1)25へ供給す
る。掛算器(1)25は前記 を用いてピッチパルス列又は白色雑音の振幅を 倍しLPC合成フィルタ27へ出力する。LPC合成フィルタ27
はK/α変換器26より供給されるαパラメータをフィルタ
係数とし、掛算器(1)25より供給される されたピッチパルス列又は白色雑音を入力として音声を
合成(掛算器(2)28へ出力する。
ところでLPC合成フィルタの利得はおおむね であることが経験的に知られている。これはLPC合成フ
ィルタのインパルス応答波形の電力と入力インパルスの
電力の比が正確に になることからも容易に類推し得る。従って掛算器
(1)25のピッチパルス列又は白色雑音列の電力を一定
とすればLPC合成フィルタ27の出力電力はほぼ一定にな
り、LPC合成フィルタ27の動作範囲の上限近くに算大合
成波形振幅がほぼ保たれる様に設定することは極めて容
易である。
ィルタのインパルス応答波形の電力と入力インパルスの
電力の比が正確に になることからも容易に類推し得る。従って掛算器
(1)25のピッチパルス列又は白色雑音列の電力を一定
とすればLPC合成フィルタ27の出力電力はほぼ一定にな
り、LPC合成フィルタ27の動作範囲の上限近くに算大合
成波形振幅がほぼ保たれる様に設定することは極めて容
易である。
LPC合成フィルタ27により合成された音声波形は掛算
器(2)28により され、分析側電力と対応付けられた後、出力ライン2001
に送出される。
器(2)28により され、分析側電力と対応付けられた後、出力ライン2001
に送出される。
以上説明した如く本発明によれば、音声合成フィルタ
の出力波形に対して利得調整を施す機能と、合成側で正
規化予測残差電力を算出する機能とを有することによ
り、常に音声合成フィルタをダイナミックレンジの上限
近くで使用することが可能となり、合成音質を大幅に改
善した音声分析合成装置を実現できるという効果があ
る。
の出力波形に対して利得調整を施す機能と、合成側で正
規化予測残差電力を算出する機能とを有することによ
り、常に音声合成フィルタをダイナミックレンジの上限
近くで使用することが可能となり、合成音質を大幅に改
善した音声分析合成装置を実現できるという効果があ
る。
第1図は本発明による音声分析合成装置の一実施例の構
成を示すブロック図である。 1……分析側、2……合成側、11……窓処理器、12……
LPC分析器、13……ピッチ抽出器、14……電力算出器、1
5……K量子化器、16……ピッチ量子化器、17……電力
量子化器、18……マルチプレクサ、19……デマルチプレ
クサ、20……K復号化器、21……ピッチ復号化器、22…
…電力復号化器、23……正規化予測電力算出器、24……
1/2乗器(1)、25……掛算器(1)、26……K/α変換
器、27……LPC合成フィルタ、28……掛算器(2)、29
……ピッチパルス発生器、30……雑音発生器、31……切
換器、32……1/2乗器(2)。
成を示すブロック図である。 1……分析側、2……合成側、11……窓処理器、12……
LPC分析器、13……ピッチ抽出器、14……電力算出器、1
5……K量子化器、16……ピッチ量子化器、17……電力
量子化器、18……マルチプレクサ、19……デマルチプレ
クサ、20……K復号化器、21……ピッチ復号化器、22…
…電力復号化器、23……正規化予測電力算出器、24……
1/2乗器(1)、25……掛算器(1)、26……K/α変換
器、27……LPC合成フィルタ、28……掛算器(2)、29
……ピッチパルス発生器、30……雑音発生器、31……切
換器、32……1/2乗器(2)。
Claims (1)
- 【請求項1】合成側に設けられ正規化予測残差電力を算
出する算出手段と、前記算出手段により算出された正規
化予測残差電力値で合成側の音声合成フィルタの入力波
形に対して利得調整を於す第1の調整手段と、分析側で
分析され合成側へ送られた電力値で前記音声合成フィル
タの出力波形に対して利得調整を於す第2の調整手段と
を有して成ることを特徴とする線形予測型音声分析合成
装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP60096223A JP2535809B2 (ja) | 1985-05-07 | 1985-05-07 | 線形予測型音声分析合成装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP60096223A JP2535809B2 (ja) | 1985-05-07 | 1985-05-07 | 線形予測型音声分析合成装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS61255000A JPS61255000A (ja) | 1986-11-12 |
| JP2535809B2 true JP2535809B2 (ja) | 1996-09-18 |
Family
ID=14159233
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP60096223A Expired - Lifetime JP2535809B2 (ja) | 1985-05-07 | 1985-05-07 | 線形予測型音声分析合成装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2535809B2 (ja) |
-
1985
- 1985-05-07 JP JP60096223A patent/JP2535809B2/ja not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| JPS61255000A (ja) | 1986-11-12 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2763322B2 (ja) | 音声処理方法 | |
| US4220819A (en) | Residual excited predictive speech coding system | |
| JPH10149199A (ja) | 音声符号化方法、音声復号化方法、音声符号化装置、音声復号化装置、電話装置、ピッチ変換方法及び媒体 | |
| JP2586043B2 (ja) | マルチパルス符号化装置 | |
| JP2535809B2 (ja) | 線形予測型音声分析合成装置 | |
| JP3510168B2 (ja) | 音声符号化方法及び音声復号化方法 | |
| JPH087597B2 (ja) | 音声符号化器 | |
| JPH0235994B2 (ja) | ||
| JP3282595B2 (ja) | 音声符号化・復号化装置及び通信装置 | |
| JPH0636157B2 (ja) | 帯域分割型ボコ−ダ | |
| JPH08160993A (ja) | 音声分析合成器 | |
| JP2629762B2 (ja) | ピッチ抽出装置 | |
| JP2581050B2 (ja) | 音声分析合成装置 | |
| JP2639118B2 (ja) | マルチパルス型音声符号復号化装置 | |
| JP2973966B2 (ja) | 音声通信装置 | |
| JPH0736119B2 (ja) | 区分的最適関数近似方法 | |
| JP2853126B2 (ja) | マルチパルス符号化装置 | |
| JPH0754438B2 (ja) | 音声処理装置 | |
| JPH0582600B2 (ja) | ||
| JPS584200A (ja) | 音程補正方式 | |
| JPH053600B2 (ja) | ||
| JPS60260100A (ja) | 音声合成器 | |
| JPH043876B2 (ja) | ||
| JPS61219998A (ja) | パタンマツチングボコ−ダ | |
| JPH052158B2 (ja) |