JPS5897093A - 音声合成方法 - Google Patents
音声合成方法Info
- Publication number
- JPS5897093A JPS5897093A JP56195207A JP19520781A JPS5897093A JP S5897093 A JPS5897093 A JP S5897093A JP 56195207 A JP56195207 A JP 56195207A JP 19520781 A JP19520781 A JP 19520781A JP S5897093 A JPS5897093 A JP S5897093A
- Authority
- JP
- Japan
- Prior art keywords
- vowel
- phonological
- chain
- vowels
- phoneme
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Developing Agents For Electrophotography (AREA)
- Audible-Bandwidth Dynamoelectric Transducers Other Than Pickups (AREA)
- Diaphragms For Electromechanical Transducers (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本発明は、音韻連鎖の組み合わせでもって、任意始業を
合成する音声合成方法に関するものであって、とくに、
上記音韻連鎖が母音・子音・母音から成る時、上記母音
・子音・母音音韻連鎖をそのもとになる母音・子音・母
音音韻連鎖から切り出すための有効な方法を提供するも
のである。
合成する音声合成方法に関するものであって、とくに、
上記音韻連鎖が母音・子音・母音から成る時、上記母音
・子音・母音音韻連鎖をそのもとになる母音・子音・母
音音韻連鎖から切り出すための有効な方法を提供するも
のである。
任意始業を合成する音声合成装置を構成するには、任意
始業に対応するすべての音響パラメーターをメモリに記
憶させておくか、あるいは、基本となる音韻連鎖の音韻
結合様式を表わす音響パラメーター、および上記音韻連
鎖を連結するための規則をメモリに記憶させておいて、
上記音韻連鎖を上記連結規則に従って連結する方法とが
考えられる。
始業に対応するすべての音響パラメーターをメモリに記
憶させておくか、あるいは、基本となる音韻連鎖の音韻
結合様式を表わす音響パラメーター、および上記音韻連
鎖を連結するための規則をメモリに記憶させておいて、
上記音韻連鎖を上記連結規則に従って連結する方法とが
考えられる。
自然性のある合成音を得ようとするならば、任意始業に
対応するすべての音響パラメーターを記憶させておくの
が理・想的であるが、現段階ではすべての音響パラメー
ターを記憶できるような、安価な大容量メモリは存在し
ない。
対応するすべての音響パラメーターを記憶させておくの
が理・想的であるが、現段階ではすべての音響パラメー
ターを記憶できるような、安価な大容量メモリは存在し
ない。
ゆえに、合成音の自然性をできるだけ損わないように音
韻連鎖を選定し、且つ音韻連鎖の適当な連結規則を見出
すことが必要である。しかも、たとえ音韻連鎖が小容量
のメモリに収まったとしても、連結規則が複雑になって
は演算処理が増えるので、連結規則を簡素化しうるよう
な音韻連鎖を選定しなければならない。このような観点
から、音韻連鎖のファイルを構成する要素の一部として
母音・子音・母音の音韻連鎖を選ぶことにした。
韻連鎖を選定し、且つ音韻連鎖の適当な連結規則を見出
すことが必要である。しかも、たとえ音韻連鎖が小容量
のメモリに収まったとしても、連結規則が複雑になって
は演算処理が増えるので、連結規則を簡素化しうるよう
な音韻連鎖を選定しなければならない。このような観点
から、音韻連鎖のファイルを構成する要素の一部として
母音・子音・母音の音韻連鎖を選ぶことにした。
本発明達者は、この母音・子音・母音の音韻連鎖の切シ
出し方について研究を重ね、音韻連鎖の連結規則を簡素
化しうるよ°うな、母音・子音・母音の音韻連鎖の切シ
出し点を見出した。
出し方について研究を重ね、音韻連鎖の連結規則を簡素
化しうるよ°うな、母音・子音・母音の音韻連鎖の切シ
出し点を見出した。
以下、本発明について詳細に説明する。まず、母音・子
音・母音を用いた任意始業の音声合成方法の概略を説明
する。
音・母音を用いた任意始業の音声合成方法の概略を説明
する。
鳴母音・子音・母音音韻連鎖の連結を用いた任意語実音
声合成方法の一例を日本語に関して述べると、日本語で
用いるすべての母音・子音・母音及゛び母音・母音の組
み合わせと、単語の語頭の1モの組み合わせを持つ音韻
連鎖ファイルの中から、1個ないし複数個の音韻連鎖を
組み合わせ、連結させることにより成し遂げられる。
・音韻連鎖の音韻結合様式を表わす音響パラ
メーターとしてはいろいろ考えられるが、以下、PAR
COR方式による音響パラメーターを考えていく。
声合成方法の一例を日本語に関して述べると、日本語で
用いるすべての母音・子音・母音及゛び母音・母音の組
み合わせと、単語の語頭の1モの組み合わせを持つ音韻
連鎖ファイルの中から、1個ないし複数個の音韻連鎖を
組み合わせ、連結させることにより成し遂げられる。
・音韻連鎖の音韻結合様式を表わす音響パラ
メーターとしてはいろいろ考えられるが、以下、PAR
COR方式による音響パラメーターを考えていく。
PAROOR係数とは、声道のフィルタ特性を表わす一
種の係数(8次〜10次)であって、このPARCOR
係数と、音源振幅の時間変化を表わす振幅パラメーター
と、有声音のピッチの時間変化を表わすピッチパラメー
ターと、有声音・無声音・無音を区別するパラメーター
から、PARCOR方式による音響パラメーターは成り
立っている。
種の係数(8次〜10次)であって、このPARCOR
係数と、音源振幅の時間変化を表わす振幅パラメーター
と、有声音のピッチの時間変化を表わすピッチパラメー
ターと、有声音・無声音・無音を区別するパラメーター
から、PARCOR方式による音響パラメーターは成り
立っている。
通常、このPARCOR方式による音響パラター、 タ
ーのいくつか、たとえはPARCOR係数、標準的な振
幅パラメーター、有声音、無声音、無音を区別するパラ
メーターを各音韻連鎖ごとに求めて音韻連鎖ファイルに
登録する。ピッチおよび実際的な振幅パラメーターは連
結規則により付与される。
ーのいくつか、たとえはPARCOR係数、標準的な振
幅パラメーター、有声音、無声音、無音を区別するパラ
メーターを各音韻連鎖ごとに求めて音韻連鎖ファイルに
登録する。ピッチおよび実際的な振幅パラメーターは連
結規則により付与される。
実際に、母音・子音・母音音韻連鎖の連結によって任意
語案を合成する方法について第1図全参照して説明する
。第1図は、音韻連鎖にムとムSムを連結してKASム
という単語を合成した時のPARCjOR係数1.の時
間変化を表わしたものヤある。点ム1点Bはそれぞれ子
音・母音音韻連鎖の始端、終端であり、点C1点りはそ
れぞれ母音子音・母音音韻連鎖の始端、終端である。ム
B間CD間の音響パラメーターはある周期ごとに与えら
れ、実際に人間が母音・子音・母音音韻連鎖を含む無意
味単語を発声したものから求める。Be間は、子音・母
音音韻連鎖と母音・子音・母音音韻連鎖をつなぐ接続部
分であシ、点Bと点Cの音響パラメーターは、この間で
なめらかに補間された上で連結される。このBCの時間
長は、自然な単語音声が合成されるように適切に決めら
れた規則から求められるが、第1図の子音・、母音音韻
連鎖や母音・子音・母音音韻連鎖を適切に作ることによ
って、この規則が簡単なものiなる可能性がある。
語案を合成する方法について第1図全参照して説明する
。第1図は、音韻連鎖にムとムSムを連結してKASム
という単語を合成した時のPARCjOR係数1.の時
間変化を表わしたものヤある。点ム1点Bはそれぞれ子
音・母音音韻連鎖の始端、終端であり、点C1点りはそ
れぞれ母音子音・母音音韻連鎖の始端、終端である。ム
B間CD間の音響パラメーターはある周期ごとに与えら
れ、実際に人間が母音・子音・母音音韻連鎖を含む無意
味単語を発声したものから求める。Be間は、子音・母
音音韻連鎖と母音・子音・母音音韻連鎖をつなぐ接続部
分であシ、点Bと点Cの音響パラメーターは、この間で
なめらかに補間された上で連結される。このBCの時間
長は、自然な単語音声が合成されるように適切に決めら
れた規則から求められるが、第1図の子音・、母音音韻
連鎖や母音・子音・母音音韻連鎖を適切に作ることによ
って、この規則が簡単なものiなる可能性がある。
次に、本発明における母音・子音・母音音韻連鎖の作シ
方の一例を、第2図を用いて説明する。
方の一例を、第2図を用いて説明する。
(a) 、 (b) 、 (C)は、ムにム、ムSム、
ムT人の音韻連鎖の音響パラメーターのうち、PARC
OR係数t1だけの時間変化を図示したものである。こ
の人に人、ムSム、ムTムの音韻連鎖に相当するPAR
COR係数i1というのは、五に人、ムSム。
ムT人の音韻連鎖の音響パラメーターのうち、PARC
OR係数t1だけの時間変化を図示したものである。こ
の人に人、ムSム、ムTムの音韻連鎖に相当するPAR
COR係数i1というのは、五に人、ムSム。
ムTムの音韻連鎖を含む無意味単語を単調なイントネー
ションで発声したものをPARCOR分析して取り出し
てきたものである。このAK人。
ションで発声したものをPARCOR分析して取り出し
てきたものである。このAK人。
ムS人、五Tムに相当するPARCOR係数i1は、最
初、前の母音Aに対応するPARCOR係数覇、を完全
に含む形で切シ出されている。これをそのまま音韻連鎖
ファイルに登録しておくと、音韻連鎖を連結させる時、
母音の部分が冗長になり、不自然な合成音になる。それ
ゆえ、母音の始・終端を切りつめてから音韻連鎖ファイ
ルに登録するのが望ましい。
初、前の母音Aに対応するPARCOR係数覇、を完全
に含む形で切シ出されている。これをそのまま音韻連鎖
ファイルに登録しておくと、音韻連鎖を連結させる時、
母音の部分が冗長になり、不自然な合成音になる。それ
ゆえ、母音の始・終端を切りつめてから音韻連鎖ファイ
ルに登録するのが望ましい。
前の母音の切りつめ方を以下に述べていく。
PARCOR係数はある周期ごとに与えられているから
、周期ごとにx =、=、 k 1 (nはフィルタの
次数)が求まる。さらに、隣シ合うKの差ΔKを求める
と、ΔKはち、の変化の大小を調べる尺度となる。ΔK
が小さければ(・はその付近で定常とみなしうる。ΔK
を時間系列的に並べておいで、ΔKがある一定値を越え
ない時間までを前の母音の定常性が保存されでいる部分
として取シ云ることができる。この定常部分は取シ去っ
ても、前にくる音韻連鎖と、第1図に示したような補間
接続をすることによシ再現される。このような考えに立
って、ΔKがある一定値よシ小さい点を前の母音の切シ
出し点とする。
、周期ごとにx =、=、 k 1 (nはフィルタの
次数)が求まる。さらに、隣シ合うKの差ΔKを求める
と、ΔKはち、の変化の大小を調べる尺度となる。ΔK
が小さければ(・はその付近で定常とみなしうる。ΔK
を時間系列的に並べておいで、ΔKがある一定値を越え
ない時間までを前の母音の定常性が保存されでいる部分
として取シ云ることができる。この定常部分は取シ去っ
ても、前にくる音韻連鎖と、第1図に示したような補間
接続をすることによシ再現される。このような考えに立
って、ΔKがある一定値よシ小さい点を前の母音の切シ
出し点とする。
切シ出し点と始端とを結ぶ長さklとした時、Eは前の
母音と子音の種類による依存性を受けて変化する。この
Eが求まったとして、本発明による切シ出し長の決め方
を示す。lは音韻連鎖の種類により異なるが、母音ごと
にそのEを比較し、最少のJ!min、vを求める。同
一母音、で始まる音韻連鎖は始端よりすべてnmtnl
Vの長さ分切シ取っとを後の母音についても行なう。こ
の新たな始端、終端をその音韻連鎖の始端、終端とし、
音韻連鎖ファイルに登録する。
母音と子音の種類による依存性を受けて変化する。この
Eが求まったとして、本発明による切シ出し長の決め方
を示す。lは音韻連鎖の種類により異なるが、母音ごと
にそのEを比較し、最少のJ!min、vを求める。同
一母音、で始まる音韻連鎖は始端よりすべてnmtnl
Vの長さ分切シ取っとを後の母音についても行なう。こ
の新たな始端、終端をその音韻連鎖の始端、終端とし、
音韻連鎖ファイルに登録する。
これは、次のような考えによる。Eを各々の音韻連鎖に
ついて粂めたことにより、その音韻連鎖の音響パラメー
ターの定常性を調べることができる。しかしながら、こ
のEは同一母音であっても後に接続する子音によって長
さが異なる。AHlin、vという一定値でもって、同
一母音の音韻連鎖の始端(もしくは終端)を決定すれば
、子音による母音の長さの依存部分は切シ出された音韻
連鎖内に含まれ、母音固有の長さは、取シ去られた部分
に含まれる。この母音固有の長さの調整は、連結規則の
中に含めておき、連結する際考慮す扛ばよい。
ついて粂めたことにより、その音韻連鎖の音響パラメー
ターの定常性を調べることができる。しかしながら、こ
のEは同一母音であっても後に接続する子音によって長
さが異なる。AHlin、vという一定値でもって、同
一母音の音韻連鎖の始端(もしくは終端)を決定すれば
、子音による母音の長さの依存部分は切シ出された音韻
連鎖内に含まれ、母音固有の長さは、取シ去られた部分
に含まれる。この母音固有の長さの調整は、連結規則の
中に含めておき、連結する際考慮す扛ばよい。
もし、すべての音韻連鎖を同一のβm10で切シ出2し
たとすれば、#m1n+は1miユ、Vよシ小さくなる
はずで、音韻連鎖ファイルが増大してしまう。また、も
し各々の音韻連鎖をそれぞれのeで切り出し蛇とすれば
、音韻連鎖ファイルば縮少されるが、その代わり連結の
際にどの位、音韻連鎖間を補間すればよいのか、という
情報が各々の音韻連鎖に必要で連結規則がよシ複雑にな
る。以上のことを考慮して、切り出し長としてEmiユ
、Vが採用された。
たとすれば、#m1n+は1miユ、Vよシ小さくなる
はずで、音韻連鎖ファイルが増大してしまう。また、も
し各々の音韻連鎖をそれぞれのeで切り出し蛇とすれば
、音韻連鎖ファイルば縮少されるが、その代わり連結の
際にどの位、音韻連鎖間を補間すればよいのか、という
情報が各々の音韻連鎖に必要で連結規則がよシ複雑にな
る。以上のことを考慮して、切り出し長としてEmiユ
、Vが採用された。
以上のようにして切シ出された音韻連鎖を連結して、任
意単語を発声させる方法を第3図を用いて説明する。
意単語を発声させる方法を第3図を用いて説明する。
まず、入力された音韻記号系列により指定された始業に
対応する連結規則が、制御装置1の指示に従って、連結
規則ファイル4から読み出される。
対応する連結規則が、制御装置1の指示に従って、連結
規則ファイル4から読み出される。
次に、音韻記号系列に従い音韻連鎖ファイル6からPA
RCOR係数の形で蓄えられた音韻連鎖が順次読み出さ
れ、合成装置2に送られる。合成装置2では、先に読み
出された連結情報に基づき、音韻連鎖を結合する時の時
間間隔を設定し、その間、PARCOR係数を補間しな
がら音韻連鎖を連結する。さらに、ピッチ、振幅値を、
連結情報に基ついて、連結された音韻連鎖全体に付与す
る。
RCOR係数の形で蓄えられた音韻連鎖が順次読み出さ
れ、合成装置2に送られる。合成装置2では、先に読み
出された連結情報に基づき、音韻連鎖を結合する時の時
間間隔を設定し、その間、PARCOR係数を補間しな
がら音韻連鎖を連結する。さらに、ピッチ、振幅値を、
連結情報に基ついて、連結された音韻連鎖全体に付与す
る。
合成装置2で作成された合成音は、°音声発生装置3に
送られて、発声させられる。
送られて、発声させられる。
以上のように本発明は、音韻連鎖を切り出す際に母音ご
とに一定長(Jmin、v)で切り出すようにしている
ので、子音による母音の長さの変動部分は音韻連鎖内部
に含ませることができる。この結果、連結の際子音の影
響は考慮する必要がなく、母音による影響のみを考慮す
ればよい。また、母音ごとに切シ出し長を決めているの
で、多少規則は増えるが、それぞれの母音に対してZr
n1n、vを決めたので、音韻連鎖ファイルは圧縮され
る。以上のように音韻連鎖の切り出し方は、音韻連鎖フ
ァイル、音韻連鎖の連結規則双方にとって、非常に有効
である。
とに一定長(Jmin、v)で切り出すようにしている
ので、子音による母音の長さの変動部分は音韻連鎖内部
に含ませることができる。この結果、連結の際子音の影
響は考慮する必要がなく、母音による影響のみを考慮す
ればよい。また、母音ごとに切シ出し長を決めているの
で、多少規則は増えるが、それぞれの母音に対してZr
n1n、vを決めたので、音韻連鎖ファイルは圧縮され
る。以上のように音韻連鎖の切り出し方は、音韻連鎖フ
ァイル、音韻連鎖の連結規則双方にとって、非常に有効
である。
第1図は音韻連鎖に人とAs人を連結した際のPARC
OR係数の変化の様子を示した図、第2図は音韻連鎖ム
KA、ムSム、ムTムのPARCOR係数の時間変化を
示した図、第3図は本発明の一実施例を説明するための
ブロック図である。 1・・・・・・制御装置、2・・・・−・合成装置、3
・・・・・・音声発生装置、4・・・・・・連結規則フ
ァイル、6・・・・・・音韻連鎖ファイル。 代理人の氏名 弁理士 中 尾 敏男 ほか1名第1図 差。 12図 4WJ −〇) 罐
OR係数の変化の様子を示した図、第2図は音韻連鎖ム
KA、ムSム、ムTムのPARCOR係数の時間変化を
示した図、第3図は本発明の一実施例を説明するための
ブロック図である。 1・・・・・・制御装置、2・・・・−・合成装置、3
・・・・・・音声発生装置、4・・・・・・連結規則フ
ァイル、6・・・・・・音韻連鎖ファイル。 代理人の氏名 弁理士 中 尾 敏男 ほか1名第1図 差。 12図 4WJ −〇) 罐
Claims (1)
- 音韻連鎖の音韻結合様式が、音響パラメーターの時間系
列で表わされていて、上記音韻連鎖として、種々の母音
、子音の組み合わせからなる母音・子音・母音の音韻連
鎖を、少なくともその一構成部分として含む音韻連鎖フ
ァイルを使用し、上記音韻連鎖ファイルの中の音韻連鎖
を組み合わせることによって、任意始業を合成するに際
して、上記母音・子音・母音の音韻連鎖の各々として、
母音、子音に対応する音響パラメーターを完全に含む母
音・子音・母音の音韻連鎖から、前の母音に固有の一定
時間分だけ前の母音の始端から前の母音に対応する音響
パラメーターを、また、後の母音に固有の一定時間分だ
け後の母音の終端から後の母音に対応する音響パラメー
)−を、それぞれ取シ云ったものを用いることを特徴と
する音声合成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP56195207A JPS5897093A (ja) | 1981-12-03 | 1981-12-03 | 音声合成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP56195207A JPS5897093A (ja) | 1981-12-03 | 1981-12-03 | 音声合成方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS5897093A true JPS5897093A (ja) | 1983-06-09 |
Family
ID=16337234
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP56195207A Pending JPS5897093A (ja) | 1981-12-03 | 1981-12-03 | 音声合成方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS5897093A (ja) |
-
1981
- 1981-12-03 JP JP56195207A patent/JPS5897093A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5524172A (en) | Processing device for speech synthesis by addition of overlapping wave forms | |
US4685135A (en) | Text-to-speech synthesis system | |
US4398059A (en) | Speech producing system | |
EP0059880A2 (en) | Text-to-speech synthesis system | |
JPS62160495A (ja) | 音声合成装置 | |
JPH031200A (ja) | 規則型音声合成装置 | |
JP3518898B2 (ja) | 音声合成装置 | |
US6829577B1 (en) | Generating non-stationary additive noise for addition to synthesized speech | |
JPS5897093A (ja) | 音声合成方法 | |
JPH08248993A (ja) | 音韻時間長制御方法 | |
JPS5972494A (ja) | 規則合成方式 | |
JP3081300B2 (ja) | 残差駆動型音声合成装置 | |
JP2987089B2 (ja) | 音声素片作成方法および音声合成方法とその装置 | |
JP3241582B2 (ja) | 韻律制御装置及び方法 | |
JP2709385B2 (ja) | 多層ラベルを持つ音声データベース構成方法 | |
JPH08160991A (ja) | 音声素片作成方法および音声合成方法、装置 | |
JP2577372B2 (ja) | 音声合成装置および方法 | |
JPH0358100A (ja) | 規則型音声合成装置 | |
JPS5876900A (ja) | 音声合成方法 | |
JPH0447840B2 (ja) | ||
Chu | Speech synthesis by concatenation of Digital waveform fragments | |
JPS61143799A (ja) | 音声合成方式 | |
JPH0756591A (ja) | 音声合成装置、音声合成方法及び記録媒体 | |
JPH06138894A (ja) | 音声合成装置及び音声合成方法 | |
JPS63223697A (ja) | 音声規則合成用パラメ−タの作成方法 |