JPH0318900A - 音声合成装置 - Google Patents
音声合成装置Info
- Publication number
- JPH0318900A JPH0318900A JP1153745A JP15374589A JPH0318900A JP H0318900 A JPH0318900 A JP H0318900A JP 1153745 A JP1153745 A JP 1153745A JP 15374589 A JP15374589 A JP 15374589A JP H0318900 A JPH0318900 A JP H0318900A
- Authority
- JP
- Japan
- Prior art keywords
- sampling frequency
- voice
- parameter
- pitch
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002194 synthesizing effect Effects 0.000 title claims abstract description 7
- 238000005070 sampling Methods 0.000 claims abstract description 26
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 22
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 22
- 238000006243 chemical reaction Methods 0.000 claims abstract description 6
- 239000011295 pitch Substances 0.000 claims description 32
- 230000001755 vocal effect Effects 0.000 claims description 11
- 230000003595 spectral effect Effects 0.000 claims description 8
- 239000002131 composite material Substances 0.000 abstract 1
- 238000000034 method Methods 0.000 description 11
- 239000000463 material Substances 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000001339 gustatory effect Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
艮先分更
本発明は、残差波形を利用した規則音声合成方式に関し
、高品位な音声を合成するための分析合成系に係わり、
特に音声合成器にも使用できるものである。
、高品位な音声を合成するための分析合成系に係わり、
特に音声合成器にも使用できるものである。
盗」0支権
本発明に係る従来技術としては以下のものがある。「音
声合成技術」(情報処理Vo1.24 No、8ρρ。
声合成技術」(情報処理Vo1.24 No、8ρρ。
993−1000)には音声生成モデルとして音源にパ
ルス周期と雑音を切り替えて用いる方式が開示されてい
る。
ルス周期と雑音を切り替えて用いる方式が開示されてい
る。
また、特開昭61−121097号公報記載の発明では
、音声合成器のサンプリング周波数を周期的に変化させ
ることによってビブラートをかけてより自然な音声を合
成している。
、音声合成器のサンプリング周波数を周期的に変化させ
ることによってビブラートをかけてより自然な音声を合
成している。
従来の音声合成器は、音声のスペクトル包絡を表現する
声道フィルタと、音声のピッチ周期、振幅、スペクトル
微細構造を表現する味動音源信号生成装置から構成され
る。通常、声道フィルタはPARCOR(偏自己相関)
方式やLSP(線スペクトル対)方式などのデジタルフ
ィルタで構成され、駆動音源はインパルスやホワイトノ
イズを切り換えて用いられる。
声道フィルタと、音声のピッチ周期、振幅、スペクトル
微細構造を表現する味動音源信号生成装置から構成され
る。通常、声道フィルタはPARCOR(偏自己相関)
方式やLSP(線スペクトル対)方式などのデジタルフ
ィルタで構成され、駆動音源はインパルスやホワイトノ
イズを切り換えて用いられる。
また、駆動音源として、人間の原音声信号を逆フイルタ
リング処理して得た残差波形を用いることもある。これ
は、スペクトルパラメータで近似できなかった成分を音
源でカバーして、音質向上を狙ったものである。
リング処理して得た残差波形を用いることもある。これ
は、スペクトルパラメータで近似できなかった成分を音
源でカバーして、音質向上を狙ったものである。
この残差波形を用いる方式としては、1ピンチの残差波
形を保存しておき、これをピッチ周期で繰り返すことで
異なったピッチの残差波形を合成する方式や、音節等の
長さを単位として保存しておき、これを音声資料のピッ
チ周期ごとに部分的な削除、挿入などの処理を行なうこ
とで異ったピッチの残差波形を合成する方式がある。
形を保存しておき、これをピッチ周期で繰り返すことで
異なったピッチの残差波形を合成する方式や、音節等の
長さを単位として保存しておき、これを音声資料のピッ
チ周期ごとに部分的な削除、挿入などの処理を行なうこ
とで異ったピッチの残差波形を合成する方式がある。
これらの方式では、合成時のピッチは残差波形を合成す
る周期によって決定され、さらにこの周期はサンプリン
グ周波数で量子化されているため、合成音声のピッチ周
波数は段階的にしか得られない。例えばサンプリング周
波形が10に11zのとき、250七のピッチの次は約
256土となる。一方、人間の発声した音声のピッチに
は微妙なゆらぎがあり、その変動中はピッチ周波数の1
%程度であることが知られている。従って、これらの方
式でピッチのゆらぎを表現するためにはかなり高いサン
プリング周波数を用いる必要がある。
る周期によって決定され、さらにこの周期はサンプリン
グ周波数で量子化されているため、合成音声のピッチ周
波数は段階的にしか得られない。例えばサンプリング周
波形が10に11zのとき、250七のピッチの次は約
256土となる。一方、人間の発声した音声のピッチに
は微妙なゆらぎがあり、その変動中はピッチ周波数の1
%程度であることが知られている。従って、これらの方
式でピッチのゆらぎを表現するためにはかなり高いサン
プリング周波数を用いる必要がある。
またこれらの方式では、音声資料と異なるピッチの音声
を合成する場合に、残差波形の部分的な削除や挿入によ
ってピッチ周期ごとに不連続な部分ができ、これが合成
音の音質を劣化させる原因となっている。
を合成する場合に、残差波形の部分的な削除や挿入によ
ってピッチ周期ごとに不連続な部分ができ、これが合成
音の音質を劣化させる原因となっている。
且−−−眞
本発明は、上述のごとき欠点を解決するためになされた
もので、ピッチの異なる音声の合成を残差波形を変化す
ることで行なうのでない。音声資料から得られた残差波
形は音素等を単位として合成時にそのまま用い、D/A
変換器のサンプリング周波数を変化させ、このサンプリ
ング周波数に合うように声道フィルタに与えるパラメー
タを変換することで、ピッチの異なる音声を合成する音
声合成装置を提供することを目的としてなされたもので
ある。
もので、ピッチの異なる音声の合成を残差波形を変化す
ることで行なうのでない。音声資料から得られた残差波
形は音素等を単位として合成時にそのまま用い、D/A
変換器のサンプリング周波数を変化させ、このサンプリ
ング周波数に合うように声道フィルタに与えるパラメー
タを変換することで、ピッチの異なる音声を合成する音
声合成装置を提供することを目的としてなされたもので
ある。
眉−一」又
本発明は、上記目的を達成するために、声道の特性ある
いは、音声のスペクトル包絡を模擬するフィルタ回路と
同回路を廃動する音源とからなる音声合成装置において
、サンプリング周波数が可変のD/A変換器と、サンプ
リング周波数に対応してフィルタ回路の周波数特性が変
わらないようにスペクトルパラメータを変換する変換回
路とを有し、前記サンプリング周波数を変化させること
によって、音声のスペクトル包絡特性はそのままで、異
なるピッチの音声の合成を可能とすることを特徴とした
ものである。以下、本発明の実施例に基づいて説明する
。
いは、音声のスペクトル包絡を模擬するフィルタ回路と
同回路を廃動する音源とからなる音声合成装置において
、サンプリング周波数が可変のD/A変換器と、サンプ
リング周波数に対応してフィルタ回路の周波数特性が変
わらないようにスペクトルパラメータを変換する変換回
路とを有し、前記サンプリング周波数を変化させること
によって、音声のスペクトル包絡特性はそのままで、異
なるピッチの音声の合成を可能とすることを特徴とした
ものである。以下、本発明の実施例に基づいて説明する
。
第1図は、本発明による音声合成装置の一実施例を説明
するための構成図で、図中、1は残差波形、2は声道特
性パラメータ、3はピッチパラメータ、4は合成フィル
タ、5はパラメータ変換部、6はD/A変換部である。
するための構成図で、図中、1は残差波形、2は声道特
性パラメータ、3はピッチパラメータ、4は合成フィル
タ、5はパラメータ変換部、6はD/A変換部である。
ここで、声道特性パラメータ2をLSPパラメータとし
て考えるとする。残差波形1は、Cv等を単位とした音
声資料をLSP分析して得られた残差波形を、合成する
音韻で組み合わせたものである。声道特性パラメータ2
も同様にして、Cv等を単位としたLSPパラメータを
、合成する音韻で組み合わせたものである。これらのパ
ラメータを組み合わせるところでおきる不連続点の影響
を減少させるために、なんらかの補間やスムージングの
処理を行うこともできる。合成音声のピッチ周波数は、
音声資料のピッチ周波数と分析時のサンプリング周波数
と合成時のサンプリング周波数によって決まる。音声資
料のピッチ周波数をfr、分析時のサンプリング周波数
をfl、合成時のサンプリング周波数をflとすると、
合成音のピッチ数fwは fl となる。ここで、音声資料のピッチ周波数frと分析時
のサンプリング周波数f1を一定にすればfr/flは
一定値になり、合成音のピッチ数fwと合成時のサンプ
リング周波数f2は比例関係になり、制御が簡略化され
る。
て考えるとする。残差波形1は、Cv等を単位とした音
声資料をLSP分析して得られた残差波形を、合成する
音韻で組み合わせたものである。声道特性パラメータ2
も同様にして、Cv等を単位としたLSPパラメータを
、合成する音韻で組み合わせたものである。これらのパ
ラメータを組み合わせるところでおきる不連続点の影響
を減少させるために、なんらかの補間やスムージングの
処理を行うこともできる。合成音声のピッチ周波数は、
音声資料のピッチ周波数と分析時のサンプリング周波数
と合成時のサンプリング周波数によって決まる。音声資
料のピッチ周波数をfr、分析時のサンプリング周波数
をfl、合成時のサンプリング周波数をflとすると、
合成音のピッチ数fwは fl となる。ここで、音声資料のピッチ周波数frと分析時
のサンプリング周波数f1を一定にすればfr/flは
一定値になり、合成音のピッチ数fwと合成時のサンプ
リング周波数f2は比例関係になり、制御が簡略化され
る。
合成フィルタ4は、LSP合成回路等で実現される。パ
ラメータ変換部5では声道特性バラメータ2をサンプリ
ング周波数が変化した場合の合成フィルタの周波数特性
かもとの周波数特性と等価になるようにパラメータを変
換する。基本的には、パラメータをリニアな周波数軸上
に写像したとき、分析時のサンプリング周波数flと合
成時のサンプリング周波数f2の比f 1/ f 2で
周波数軸を伸縮することで近似できる。LSPパラメー
タを考えた場合、もとのLSPパラメータの値をCとす
ると、変換後のLSPパラメータC′は、c = C
os (Cos”−” (−0,5xc) xf 1/
f 2)/−0,5と近似され、パラメータ変換部と
して上記演算の演算回路を実現すればよい。
ラメータ変換部5では声道特性バラメータ2をサンプリ
ング周波数が変化した場合の合成フィルタの周波数特性
かもとの周波数特性と等価になるようにパラメータを変
換する。基本的には、パラメータをリニアな周波数軸上
に写像したとき、分析時のサンプリング周波数flと合
成時のサンプリング周波数f2の比f 1/ f 2で
周波数軸を伸縮することで近似できる。LSPパラメー
タを考えた場合、もとのLSPパラメータの値をCとす
ると、変換後のLSPパラメータC′は、c = C
os (Cos”−” (−0,5xc) xf 1/
f 2)/−0,5と近似され、パラメータ変換部と
して上記演算の演算回路を実現すればよい。
D/A変換部6は、ピッチパラメータ3から与えられる
値により、サンプリング周波数を動的に変化しながら、
合成フィルタ4からの出力をD/A変換するものである
。
値により、サンプリング周波数を動的に変化しながら、
合成フィルタ4からの出力をD/A変換するものである
。
また、本実施例のLSPパラメータ以外に、パーコール
、LPG(線形予測符号化)、フォルマントなどの他の
スペクトル特性を表わすパラメータも使用可能である。
、LPG(線形予測符号化)、フォルマントなどの他の
スペクトル特性を表わすパラメータも使用可能である。
劾−一二機
以上の説明から明らかなように、本発明によると、ピッ
チの異なる音声の合成を残差波形によって行なうのでな
く、音声資料から得られた残差波形を合成時にそのまま
用い、D/A変換器のサンプリング周波数を変化させ、
このサンプリング周波数に合うように声道フィルタに与
えるパラメータを変換することで、ピッチの異なる。゛
°1バfを合成できる。これにより、ピッチの異なる合
成音声にもゆらぎが自動的に反映される。また、ゆらぎ
を表現するためにサンプリング周波数を極端に高くする
必要もない。さらに、残差でピッチを制御する方式に発
生していたピッチ周期ごとに起きる不連続な部分の問題
もなくなる。従って、本発明により、自然で高品質な合
成音声を得ることができる。
チの異なる音声の合成を残差波形によって行なうのでな
く、音声資料から得られた残差波形を合成時にそのまま
用い、D/A変換器のサンプリング周波数を変化させ、
このサンプリング周波数に合うように声道フィルタに与
えるパラメータを変換することで、ピッチの異なる。゛
°1バfを合成できる。これにより、ピッチの異なる合
成音声にもゆらぎが自動的に反映される。また、ゆらぎ
を表現するためにサンプリング周波数を極端に高くする
必要もない。さらに、残差でピッチを制御する方式に発
生していたピッチ周期ごとに起きる不連続な部分の問題
もなくなる。従って、本発明により、自然で高品質な合
成音声を得ることができる。
第1図は、本発明による音声合成装置の一実施例を説明
するための構成図である。 1・・・残差波形、2・・・声道特性パラメータ、3・
・ピッチパラメータ、 4・・・合成フィルタ、 5・・・パラメ ータ変換部、 ・D/A変換部。
するための構成図である。 1・・・残差波形、2・・・声道特性パラメータ、3・
・ピッチパラメータ、 4・・・合成フィルタ、 5・・・パラメ ータ変換部、 ・D/A変換部。
Claims (1)
- 1、声道の特性あるいは、音声のスペクトル包絡を模擬
するフィルタ回路と同回路を駆動する音源とからなる音
声合成装置において、サンプリング周波数が可変のD/
A変換器と、サンプリング周波数に対応してフィルタ回
路の周波数特性が変わらないようにスペクトルパラメー
タを変換する変換回路とを有し、前記サンプリング周波
数を変化させることによって、音声のスペクトル包絡特
性はそのままで、異なるピッチの音声の合成を可能とす
ることを特徴とした音声合成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1153745A JPH0318900A (ja) | 1989-06-16 | 1989-06-16 | 音声合成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1153745A JPH0318900A (ja) | 1989-06-16 | 1989-06-16 | 音声合成装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0318900A true JPH0318900A (ja) | 1991-01-28 |
Family
ID=15569188
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1153745A Pending JPH0318900A (ja) | 1989-06-16 | 1989-06-16 | 音声合成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0318900A (ja) |
-
1989
- 1989-06-16 JP JP1153745A patent/JPH0318900A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3985814B2 (ja) | 歌唱合成装置 | |
JP2787179B2 (ja) | 音声合成システムの音声合成方法 | |
JP2763322B2 (ja) | 音声処理方法 | |
JPH031200A (ja) | 規則型音声合成装置 | |
EP1422693A1 (en) | PITCH WAVEFORM SIGNAL GENERATION APPARATUS, PITCH WAVEFORM SIGNAL GENERATION METHOD, AND PROGRAM | |
JP3430985B2 (ja) | 合成音生成装置 | |
JP3732793B2 (ja) | 音声合成方法、音声合成装置及び記録媒体 | |
JPH03136100A (ja) | 音声処理方法及び装置 | |
JP3278863B2 (ja) | 音声合成装置 | |
JPH02201500A (ja) | 音声合成装置 | |
JP2583883B2 (ja) | 音声分析装置および音声合成装置 | |
JPH0318900A (ja) | 音声合成装置 | |
JPH05500573A (ja) | 低減されたスペクトルひずみを有するポストフィルタを備えたデジタル音声デコーダ | |
JP3394281B2 (ja) | 音声合成方式および規則合成装置 | |
JP3994333B2 (ja) | 音声辞書作成装置、音声辞書作成方法、及び、プログラム | |
JPH07261798A (ja) | 音声分析合成装置 | |
JPS58168097A (ja) | 音声合成装置 | |
JPH0876799A (ja) | 広帯域音声信号復元方法 | |
JP2580123B2 (ja) | 音声合成装置 | |
JPH1031496A (ja) | 楽音発生装置 | |
Yazu et al. | The speech synthesis system for an unlimited Japanese vocabulary | |
JP3284634B2 (ja) | 規則音声合成装置 | |
JPH03144498A (ja) | 音源信号生成装置 | |
JPS61128299A (ja) | 音声処理装置 | |
JPH01187000A (ja) | 音声合成装置 |