JPH01224800A - 残差駆動型音声合成装置 - Google Patents
残差駆動型音声合成装置Info
- Publication number
- JPH01224800A JPH01224800A JP63052168A JP5216888A JPH01224800A JP H01224800 A JPH01224800 A JP H01224800A JP 63052168 A JP63052168 A JP 63052168A JP 5216888 A JP5216888 A JP 5216888A JP H01224800 A JPH01224800 A JP H01224800A
- Authority
- JP
- Japan
- Prior art keywords
- residual
- interpolation
- phoneme
- waveform
- frequency spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002194 synthesizing effect Effects 0.000 title claims description 3
- 238000001228 spectrum Methods 0.000 claims abstract description 22
- 230000015572 biosynthetic process Effects 0.000 claims description 22
- 238000003786 synthesis reaction Methods 0.000 claims description 22
- 230000006866 deterioration Effects 0.000 abstract description 6
- 238000000034 method Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は残差駆動型音声合成装置に関し、特に線形予測
等のパラメータ分析を行った際の予測残差を音源として
用いる残差駆動型音声合成装置に関する。
等のパラメータ分析を行った際の予測残差を音源として
用いる残差駆動型音声合成装置に関する。
線形予測分析等を行って得られたパラメータを用いた音
声合成における合成音声の品質を向上するための方法と
して、音源にパラメータ分析を行った際の予測誤差であ
る残差を用いる方法がある。
声合成における合成音声の品質を向上するための方法と
して、音源にパラメータ分析を行った際の予測誤差であ
る残差を用いる方法がある。
例えば、子音区間に対しては残差をそのまま用い、母音
区間では代表的な1ピッチ分の残差を用いる方法や、あ
るいは残差を零位相化した波形を用いる方法等が知られ
ている。このような従来技術については、日本音響学会
音声研究会資料883−65 (1984−01)r素
片編集型規則合成システムにおける素片の選択と補間法
j等で詳述されている。
区間では代表的な1ピッチ分の残差を用いる方法や、あ
るいは残差を零位相化した波形を用いる方法等が知られ
ている。このような従来技術については、日本音響学会
音声研究会資料883−65 (1984−01)r素
片編集型規則合成システムにおける素片の選択と補間法
j等で詳述されている。
上述した従来の方法では、音素あるいは合成の基本単位
となる素片の境界において一定の長さの補間区間を設け
、その中で直線補間等の補間方法により合成に用いる線
形予測係数等のパラメータを補間し、前後の音素あるい
は素片が滑らかに接続されるようにしていた。一方、音
源に関しては補間は行わず、前後それぞれの音素あるい
は素片から抽出された残差を補間区間の途中で切り換え
て用いていた。
となる素片の境界において一定の長さの補間区間を設け
、その中で直線補間等の補間方法により合成に用いる線
形予測係数等のパラメータを補間し、前後の音素あるい
は素片が滑らかに接続されるようにしていた。一方、音
源に関しては補間は行わず、前後それぞれの音素あるい
は素片から抽出された残差を補間区間の途中で切り換え
て用いていた。
しかしながら、実際にはパラメータの変化とともに残差
のスペクトルも徐々に変化しており、このような変化を
考慮せず音素あるいは素片の境界で音源を急変させるこ
とは、合成される音声の品質劣化の原因となる。また、
前後の音素あるいは素片のスペルトルが大きく異なる場
合には、音素あるいは素片の接続部分の短い一定区間に
おいてのみ補間を施しても、スペクトル変化は急峻にな
り、実際の音声とは異なってしまう。
のスペクトルも徐々に変化しており、このような変化を
考慮せず音素あるいは素片の境界で音源を急変させるこ
とは、合成される音声の品質劣化の原因となる。また、
前後の音素あるいは素片のスペルトルが大きく異なる場
合には、音素あるいは素片の接続部分の短い一定区間に
おいてのみ補間を施しても、スペクトル変化は急峻にな
り、実際の音声とは異なってしまう。
これに対して本発明は、音素あるいは素片の境界部分を
中心とした前後の区間において、劣化の少ない滑らかな
合成音声を生成することが可能な残差駆動型音声合成装
置を提供することを目的としている。
中心とした前後の区間において、劣化の少ない滑らかな
合成音声を生成することが可能な残差駆動型音声合成装
置を提供することを目的としている。
〔課題を解決するための手段〕
本発明の残差駆動型音声合成装置は、線形予測等のパラ
メータ分析を行った際の予測残差波形を音源として用い
る音声合成装置において、音素ごとに残差波形を記憶し
ておく手段と、前記残差波形の周波数スペクタルを求め
る手段と、前後の音素の組み合せごとに音素境界を中心
として予め定められた長さの区間において曲記残差波形
の周波数スペクトルを各周波数成分ごとに補間する手段
と、前記補間を施した残差波形の周波数スペクトルを時
間波形に変換する手段と、前記時間波形を音源として音
声を合成する手段とを有することを特徴、とする。
メータ分析を行った際の予測残差波形を音源として用い
る音声合成装置において、音素ごとに残差波形を記憶し
ておく手段と、前記残差波形の周波数スペクタルを求め
る手段と、前後の音素の組み合せごとに音素境界を中心
として予め定められた長さの区間において曲記残差波形
の周波数スペクトルを各周波数成分ごとに補間する手段
と、前記補間を施した残差波形の周波数スペクトルを時
間波形に変換する手段と、前記時間波形を音源として音
声を合成する手段とを有することを特徴、とする。
まず、音素あるいは素片の境界を中心とする前後の残差
の周波数スペクトルをフーリエ変換等によってそれぞれ
求める。音素あるいは素片の境界を中心とした前後の区
間において周波数スペクトルが連続的に変化するよう、
フーリエ変換後の各周波数成分ごとに直線補間等の補間
方法によって補間部分に用いる音源の周波数スペクトル
を生成する。補間区間の長さは、前後の音素あるいは素
片の組み合せに応じて予め決められた長さを用いる。こ
の補間区間長は、例えば前後の音素あるいは素片の残差
スペクトルの差が大きい場合には長く、小さければ短く
取るようにする6次に、補間によって得られた周波数ス
ペクトルを逆フーリエ変換等によって時間領域に変換し
、得られた時間波形を駆動音源として用いる。
の周波数スペクトルをフーリエ変換等によってそれぞれ
求める。音素あるいは素片の境界を中心とした前後の区
間において周波数スペクトルが連続的に変化するよう、
フーリエ変換後の各周波数成分ごとに直線補間等の補間
方法によって補間部分に用いる音源の周波数スペクトル
を生成する。補間区間の長さは、前後の音素あるいは素
片の組み合せに応じて予め決められた長さを用いる。こ
の補間区間長は、例えば前後の音素あるいは素片の残差
スペクトルの差が大きい場合には長く、小さければ短く
取るようにする6次に、補間によって得られた周波数ス
ペクトルを逆フーリエ変換等によって時間領域に変換し
、得られた時間波形を駆動音源として用いる。
このようにして、音素あるいは素片の境界を中心とした
前後の区間において、パラメータだけでなく音源となる
残差も補間によってその周波数スペクトルを連続的かつ
緩やかに変化させることによって、音素あるいは素片の
接続区間の付近においても劣化の少ない合成音声を得る
ことが可能となる。
前後の区間において、パラメータだけでなく音源となる
残差も補間によってその周波数スペクトルを連続的かつ
緩やかに変化させることによって、音素あるいは素片の
接続区間の付近においても劣化の少ない合成音声を得る
ことが可能となる。
次に本発明の実施例について図面を参照して説明する。
第1図は本発明の残差駆動型音声合成装置の一実施例を
示すブロック図である。
示すブロック図である。
まず、音素情報入力端子101から傘成されるべき音声
の音素情報が入力され、補間区間決定部104、残差記
憶部105及びパラメータ記憶部109に送られる。音
素あるいは素片の境界位置は補間位置入力端子102を
通して補間区間決定部104に入力される。補間区間決
定部104は前記入力された音素情報に基づき、前後の
音素あるいは素片の組み合せに応じて補間区間の長さを
決定し、前記入力された補間位置を中心として補間区間
の位置を定める。決定された補間区間長及び補間位置は
残差補間部107及びパラメータ補間部、110に送ら
れる。
の音素情報が入力され、補間区間決定部104、残差記
憶部105及びパラメータ記憶部109に送られる。音
素あるいは素片の境界位置は補間位置入力端子102を
通して補間区間決定部104に入力される。補間区間決
定部104は前記入力された音素情報に基づき、前後の
音素あるいは素片の組み合せに応じて補間区間の長さを
決定し、前記入力された補間位置を中心として補間区間
の位置を定める。決定された補間区間長及び補間位置は
残差補間部107及びパラメータ補間部、110に送ら
れる。
韻律情報入力端子103からは音素の継続時間長、音源
振幅、ピッチバタン等の韻律制御情報が入力され、合成
フィルタ部111に送られる。残差補間部107は補間
区間決定部104から送られてくる補間区間長及び補間
位置の情報に基づいて、補間に必要な残差波形を読み出
すための続出し信号を残差記憶部105に送る。残差記
憶部105は前記入力された音素情報に応じて各音素で
音源として用いる残差波形を取り出し、合成フィルタ部
111に送る。また、残差補間部107からの読出信号
に応じて補間に必要な残差を取り出し、フーリエ変換部
106に送る。フーリエ変換部106は前記残差波形を
フーリエ変換によって周波数スペクトルに変換し、残差
補間部107に送る。残差補間部107は前記残差の周
波数スペクトルを用い、補間区間において用いる音源の
周波数スペクトルを補間区間決定部104から入力され
た補間区間長に基づいて生成し、逆フーリエ変換部10
8に送る。逆フーリエ変換部108は補間によって生成
された前記周波数スペクトルを逆フーリエ変換によって
時間領域の波形に変換し、合成フィルタ部111に送る
。
振幅、ピッチバタン等の韻律制御情報が入力され、合成
フィルタ部111に送られる。残差補間部107は補間
区間決定部104から送られてくる補間区間長及び補間
位置の情報に基づいて、補間に必要な残差波形を読み出
すための続出し信号を残差記憶部105に送る。残差記
憶部105は前記入力された音素情報に応じて各音素で
音源として用いる残差波形を取り出し、合成フィルタ部
111に送る。また、残差補間部107からの読出信号
に応じて補間に必要な残差を取り出し、フーリエ変換部
106に送る。フーリエ変換部106は前記残差波形を
フーリエ変換によって周波数スペクトルに変換し、残差
補間部107に送る。残差補間部107は前記残差の周
波数スペクトルを用い、補間区間において用いる音源の
周波数スペクトルを補間区間決定部104から入力され
た補間区間長に基づいて生成し、逆フーリエ変換部10
8に送る。逆フーリエ変換部108は補間によって生成
された前記周波数スペクトルを逆フーリエ変換によって
時間領域の波形に変換し、合成フィルタ部111に送る
。
一方、パラメータ補間部110は補間区間決定部104
から送られてくる補間区間長及び補間位1の情報に基づ
いて、補間に必要なパラメータを読み出すための読出信
号をパラメータ記憶部109に送る。パラメータ記憶部
109は前記入力された音素情報に応じて各音素の合成
パラメータを取り出し、音声合成フィルタ部111に送
る。また、パラメータ補間部110からの読出信号に応
じて補間に必要なパラメータを取り出し、パラメータ補
間部110に送る。パラメータ補間部110は補間区間
決定部104から入力された補間区間長に基づき、補間
区間で用いるパラメータを生成し、合成フィルタ部11
1に送る。
から送られてくる補間区間長及び補間位1の情報に基づ
いて、補間に必要なパラメータを読み出すための読出信
号をパラメータ記憶部109に送る。パラメータ記憶部
109は前記入力された音素情報に応じて各音素の合成
パラメータを取り出し、音声合成フィルタ部111に送
る。また、パラメータ補間部110からの読出信号に応
じて補間に必要なパラメータを取り出し、パラメータ補
間部110に送る。パラメータ補間部110は補間区間
決定部104から入力された補間区間長に基づき、補間
区間で用いるパラメータを生成し、合成フィルタ部11
1に送る。
合成フィルタ部111は前記韻律情報、パラメータ、時
間領域波形及び残差を用いて音声波形を合成し、音声出
力端子112から出力する。
間領域波形及び残差を用いて音声波形を合成し、音声出
力端子112から出力する。
以上述べた構成は、あくまでも本発明の一実施例に過ぎ
ず、種々の変形も可能である。例えば、音源の周波数ス
ペクトルを求める手段としては、コサイン変換、KL変
換等の他の周知の方法を用いることができる。
ず、種々の変形も可能である。例えば、音源の周波数ス
ペクトルを求める手段としては、コサイン変換、KL変
換等の他の周知の方法を用いることができる。
以上説明したように本発明によれば、音素あるいは素片
の境界部分を中心とした前後の区間においても劣化の少
ない合成音声を生成することが可能であり、品質の高い
音声を合成できる残差駆動型音声合成装置を実現するこ
とができる効果がある。
の境界部分を中心とした前後の区間においても劣化の少
ない合成音声を生成することが可能であり、品質の高い
音声を合成できる残差駆動型音声合成装置を実現するこ
とができる効果がある。
第1図は本発明の残差駆動型音声合成装置の一実施例を
示すブロック図である。 101・・・音素情報入力端子、102・・・補間位置
入力端子、103・・・韻律情報入力端子、104・・
・補間区間決定部、105・・・残差記憶部、106・
・・フーリエ変換部、107・・・残差補間部、108
・・・逆フーリエ変換部、109・・・パラメータ記憶
部、110・・・パラメータ補間部、111・・・合成
フィルタ部、112・・・音声出力端子。
示すブロック図である。 101・・・音素情報入力端子、102・・・補間位置
入力端子、103・・・韻律情報入力端子、104・・
・補間区間決定部、105・・・残差記憶部、106・
・・フーリエ変換部、107・・・残差補間部、108
・・・逆フーリエ変換部、109・・・パラメータ記憶
部、110・・・パラメータ補間部、111・・・合成
フィルタ部、112・・・音声出力端子。
Claims (1)
- 線形予測等のパラメータ分析を行った際の予測残差波形
を音源として用いる音声合成装置において、音素ごとに
残差波形を記憶しておく手段と、前記残差波形の周波数
スペクタルを求める手段と、前後の音素の組み合せごと
に音素境界を中心として予め定められた長さの区間にお
いて前記残差波形の周波数スペクトルを各周波数成分ご
とに補間する手段と、前記補間を施した残差波形の周波
数スペクトルを時間波形に変換する手段と、前記時間波
形を音源として音声を合成する手段とを有することを特
徴とする残差駆動型音声合成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63052168A JPH01224800A (ja) | 1988-03-04 | 1988-03-04 | 残差駆動型音声合成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63052168A JPH01224800A (ja) | 1988-03-04 | 1988-03-04 | 残差駆動型音声合成装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH01224800A true JPH01224800A (ja) | 1989-09-07 |
Family
ID=12907297
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP63052168A Pending JPH01224800A (ja) | 1988-03-04 | 1988-03-04 | 残差駆動型音声合成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH01224800A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005274917A (ja) * | 2004-03-24 | 2005-10-06 | Mitsubishi Electric Corp | 音声復号装置 |
-
1988
- 1988-03-04 JP JP63052168A patent/JPH01224800A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005274917A (ja) * | 2004-03-24 | 2005-10-06 | Mitsubishi Electric Corp | 音声復号装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2782147B2 (ja) | 波形編集型音声合成装置 | |
JP4132109B2 (ja) | 音声信号の再生方法及び装置、並びに音声復号化方法及び装置、並びに音声合成方法及び装置 | |
JP3328080B2 (ja) | コード励振線形予測復号器 | |
US5682502A (en) | Syllable-beat-point synchronized rule-based speech synthesis from coded utterance-speed-independent phoneme combination parameters | |
KR970003109A (ko) | 음성 신호의 재생 방법 및 장치와 그 전송 방법 | |
US5987413A (en) | Envelope-invariant analytical speech resynthesis using periodic signals derived from reharmonized frame spectrum | |
US6950798B1 (en) | Employing speech models in concatenative speech synthesis | |
US5787398A (en) | Apparatus for synthesizing speech by varying pitch | |
JPH08254993A (ja) | 音声合成装置 | |
KR20020076144A (ko) | 음성합성방법, 음성합성장치 및 기록매체 | |
JP2600384B2 (ja) | 音声合成方法 | |
JPH01224800A (ja) | 残差駆動型音声合成装置 | |
JPS6239758B2 (ja) | ||
Edgington et al. | Residual-based speech modification algorithms for text-to-speech synthesis | |
JPH07261798A (ja) | 音声分析合成装置 | |
JPH01283600A (ja) | 残差駆動型音声合成装置 | |
JPS5925239B2 (ja) | パラメ−タ補間方式 | |
WO1995026024A1 (en) | Speech synthesis | |
JP2709198B2 (ja) | 音声合成方法 | |
JPH08160991A (ja) | 音声素片作成方法および音声合成方法、装置 | |
JP4826580B2 (ja) | 音声信号の再生方法及び装置 | |
JPH0266600A (ja) | 音声合成方式 | |
JPH0772897A (ja) | 音声合成方法および装置 | |
JPH09258796A (ja) | 音声合成方法 | |
JPS5915996A (ja) | 音声合成装置 |