JPS6385799A - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JPS6385799A
JPS6385799A JP23222886A JP23222886A JPS6385799A JP S6385799 A JPS6385799 A JP S6385799A JP 23222886 A JP23222886 A JP 23222886A JP 23222886 A JP23222886 A JP 23222886A JP S6385799 A JPS6385799 A JP S6385799A
Authority
JP
Japan
Prior art keywords
partial
pattern
micropattern
synthesis device
speech synthesis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP23222886A
Other languages
English (en)
Inventor
幹雄 山口
藤崎 博也
広瀬 啓吉
恒 河井
清水 圭典
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sumitomo Electric Industries Ltd
Original Assignee
Sumitomo Electric Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sumitomo Electric Industries Ltd filed Critical Sumitomo Electric Industries Ltd
Priority to JP23222886A priority Critical patent/JPS6385799A/ja
Publication of JPS6385799A publication Critical patent/JPS6385799A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は文字・記号等を入力とした音声合成装置に関
するものである。
〔従来の技術〕
文字・記号等を入力とした従来の音声合成装置(たとえ
ば、昭和61年度電子通信学会総合全国大会講演論文集
326−5、昭和61年3月)の処理ブロック図を第1
図に示す、また1表は上記音声合成装置への入力例を第
1表talに示す。
入力は、アクセント記号、フレーズ記号、体上記号及び
音節記号である。
アクセント記号は、AI(0,40)、A2(0,26
)及びAOであり、A1とA2によってアクセントの立
上りの音節境界と、アクセントの大きさの種類を示し、
AOでアクセントの立下りの音節境界を示す、アクセン
トの大きさは、A1、A2の記号で示される2種類があ
る。()内は実際に割当てるアクセントの大きさを示す
フレーズ記号は、Pi(0,43)、P2(0,26)
、P3(0,12)及びPOであり、Pl、、P2)P
3によってフレーズの開始時点と大きさの種類を示し、
POはそれ以前にあるPl、P2)P3によって生じた
フレーズ成分を0に減らすことを示している。()内は
実際に割当てるフレーズの大きさを示す。
体上記号はr、J(0,7秒)、「、J  (0,3秒
)「・J  (0,08秒)であり、その音節境界で休
止がおかれること、すなわち間があくことを示している
。()内は休止の長さを示す。
音節記号は「ス」 「ズ」 「メ」 「ワ」・・・・・
・等の片仮名で表わされた記号であり、音の種類を示し
ている。
入力中、○のついたもの、たとえば「シ○」は無声化さ
れた「シ」を示す。
入力によりて合成すべき音声が指示されるが、その合成
処理は次のようにして行なう。
(1)音素的パラメータの生成 音節記号により指定される音節を蓄積パタンから選び出
し、その蓄積パタン中に記載されているその音節固有の
時間長と、体上記号によって指定される休止時間をもと
にしてその音節の時点を決定する。
次に、蓄積パタンに記載されているその音節固有の音素
的パラメータ、例えばホルマント周波数と帯域幅の時間
変化パタンを読み出し、先に定めた各音節の時点が満た
されるように、音素的パラメータを伸長・圧縮させなが
ら、互いにつなぎあわせる。たとえば、ある音節C,V
、の時点をt−Qとし、次の音節CgVtがj −14
0ssecであり、C1v、の音素的パラメータが! 
−100ssecの分までしか記述されておらず、また
C、V、の音素的パラメータが t ” 140m5e
cからの分からしか蓄積パタンに記述されていないとし
たら、t”100m5ecからt = 140m5ec
までの間は、vlの部分を引き伸ばすことにより補う。
以上の処理によって、合成しようとする文音声の音素的
パラメータが得られ、音声合成器(たとえばホルマント
合成器)に送られて、音声信号生成に用いられる。
(2)  音源強度パタンの生成 音源強度は、合成する音節の種類ごとに値を定め、また
休止の前・後では、減少・増加させる必要がある。音節
の種類に固有な値は、やはり蓄積パタンに記載されてお
り、音素的パラメータと同様の伸縮処理を行なってつな
ぎ合わせることで、目的とする文の基礎的な音源強度パ
タンか得られる。さらに、休止、特に文と文の区切りを
示す「、」の休止の前後で、音源強度規則にしたがって
、一定量を減少・増加させることで、最終的な音源強度
パタンか得られ、音声合成器に送られて音声信号生成に
用いられる。
(3)  基本周波数(声の高さ、記号F0で表わす)
パタンの生成 入力中には、フレーズ及びアクセントの時点が、どの音
節境界にあるかが示されており、しかも前述のように音
節の時点が決定しているので、音節の時点を基準とする
ことでフレーズおよびアクセントの時点を決められる。
また入力中のフレーズ記号、アクセント記号の種類によ
って実際に用いる値が決まっている(たとえば、AIは
0.40)ので、これによりフレーズ指令とアクセント
指令の大きさと時点を決めることができる。フレーズお
よびアクセントの時点と大きさをもとにしてF・パタン
の生成モデルの式により、F6パタンの生成を行なう。
F・パタン生成モデルを第2図に示す、F、の時間変化
パタンをFo(t)で表わし、次の式によって計算を行
う。
であり、それぞれ臨界制動二次線形系のインパルス応答
と、ステップ応答になっている。
α、βは応答の速さを決める定数であり、α=3.0、
β−20,0程度の値を用いる。
1−(1+βt)axp(−βt)は、tが増加するに
伴って目標値1.0に漸近するが、有限の時間内でGa
 (t)を目標値に収束させるため、θ−0,9として
処理を行なっている。θ≦1の条件の場合Ga(t)の
目標値はθである。
■は、その文章内に出てくるフレーズの数を示し、Ap
ムは五番口に出てくるフレーズ指令の大きさを示す、た
とえば、PI(0,43)の記号で示されるフレーズが
来るならApt−0,43となる。 To!はそのフレ
ーズ指令の時点を示す。
Jは、その文章内に出てくるアクセントの数を示し、A
ajは1番目に出てくるアクセント指令の大きさを示す
、たとえば、1番目のアクセントとしてAI(0,40
)の記号で示されるアクセントが来るならば、Apt 
−0,40となる@ T14 %Tujは、1番目のア
クセント指令の開始時点と終了時点を示す。
1nFsinは、定数項であり、声帯の振動可能最低周
波数に対応している。たとえば、男性音声を合成すると
きは、FsinI−+ 75Hz程度に、女性音声を合
成するときはFm1n# 115Hz程度に設定する。
Fe(t)を計算するときは、前述の処理によって決ま
ったフレーズ指令の大きさと時点A9t 、To((1
≦l≦り、アクセント指令の大きさと時点Aaj%T+
7.7g7  (1≦j≦J)を前掲の0式に当てはめ
て右辺を計算し、その結果に対して対数の逆関数、すな
わち指数関数をとることにより、F+(t)を計算する
以上の処理によって得られたFo(t) 、すなわち基
本周波数パタンは、音声合成器に送られ、音声信号の生
成に用いられる。
上述の処理に用いられるハードウェアは、音声合成器(
たとえばホルマント合成器)は、信号処理プロセッサに
より実現されており、入力記号から音声合成器への入力
を作成するまでの処理は、マイクロプロセンサによって
処理される。蓄積パタンは、マイクロプロセッサのアク
セスするROMに記憶される。
また、F+(t)の計算式の計算などはマイクロプロセ
ッサのプログラムで実現されている。
以上の説明では、音節記号、体上記号、アクセント記号
、フレーズ記号を入力して、音声を合成する場合の処理
を示したが、漢字仮名混じり文章(たとえば第2図伽)
参照)を入力とする音声合成装置も知られている。この
場合、漢字仮名混じり文を前述した音節記号、体上記号
、アクセント記号、フレーズ記号に変換する処理が必要
である。
この処理は、入力文章を単語単位に分かち、単語辞書を
検索することにより読みを決定し、同じく単語辞書に書
かれたアクセント型により、アクセントの上り下りの音
節境界を決定し、アクセントの大きさを割り当てる処理
によって行なわれる。
〔発明が解決しようとする問題点〕
前記従来技術においては、前掲の0式によりF。
パタンを計算したが、0式は返信式にすぎず、実際に観
測される自然音声のFoパタンと異なる部分がある。自
然音声のFoパタンを観測すると、調音様式によってF
oパタンに局所的変動が生じる現象がある。この現象は
比較的古くから知られており、たとえば「佐藷利男、日
本音響学会論文誌、第14@第2号PP117−122
(1958年)Jr報告されている。
音声合成装置においても、この現象をうまく近位できる
ことが、自然性や明瞭性の向上に役立つことが期待され
る。また、工学的見地からは、なるべく単純な方法及び
構成で実現できることが望まれる。
この発明は、以上の点に鑑みて創案されたもので、少な
い記憶容量と簡単な制御により、調音様式により生ずる
Foパタンの局所的変動を合成音声  −に与えること
を目的としている。
〔問題点を解決するための手段〕
上記の問題を解決する手段を創案するに先立ち、まず自
然音声の分析を行うた。
(!)  音声試料と分析方法 同一のCV音節が4回連続する無意味単語/CVCVC
VCV/を単独で発声したものを試料とした。子音は、
/p/、/1/、/に/、/3/、/h/、/m/、/
n/、/W/、/r/、/j/、/b/、/d/、/g
/、/ z /の144種類母音は/i/、/e/、/
u/、10/、/a/の5種類を用い、日本語の音節と
して適切なすぺての組合せをgII4f!シた。アクセ
ント型は平板型とし、なるべく抑揚をつけずに発声した
0発声者は成人男性1名で、発声回数は各単語光り4回
である。
Fo油抽出、LPC残差の自己相関関数による方法と、
波形計測による方法を併用した。前者の方法では、LP
C分析に先立うてカン)オフ周波数500Hzの直線位
相フィルタによって低域ろ波を行った、LPG分析の次
数は11、分析窓のシフト長は2vbsecとした0分
析窓長は、窓の位置でのFoの値に適応するよう自動的
に変化させた。後者の方法では、波形上の同位相と思わ
れる点の間の距離をパーソナルコンピュータの画面上で
対話的に計測した。なお、AD変換のサンプリング周波
数は10kllz、精度は12bttである。
分析結果の一例を第3図に示す。
(2)  分析結果 子音調音に起因すると思われるFoパタンの局所的な変
動には、第4図に示すような4種類の類型があることが
明らかになった。第4図のタイプOはほとんど変動のみ
られないものである。タイプ1およびタイプ3では、い
ずれも母音から子音への出ねたりでFoパタン下降がみ
られるが、子音から母音への入りわたりでは、タイプl
は比較的顕著な下降がみられ、タイプ3では上昇がみら
れる。
タイプ2はタイプ3と類似しているが、主として子音部
と母音部の境界付近でFoパタンの急激な局所的変化が
みられる0分析に用いた子音と母音の各々の組合せにつ
いて、Foパタンの局所的変動が上記のいずれの型に属
するかを第2表にまとめて示した。
(3)  発明の構成 第5図にこの発明の構成を示す。
部分マイクロパタンテーブルは、あらかじめ自然音声を
分析して得られた調音様式に対応する基本周波数の小さ
な変化パタン(部分マイクロパタン)を記憶しである部
分である。
部分マイクロパタンを選択する部分は、音声合成装置の
入力で指示される音素(子音と母音のことを言う)の連
なり方をもとにして、その音素の調音様式に対応する部
分マイクロパタンを、部分マイクロパタンテーブルから
選び出す部分である。
たし合わせ処理を行う部分は、従来技術によって求まる
音声の基本周波数の大きな変化パタンすなわちマクロパ
タンに、同じ〈従来技術によって定まる部分マイクロパ
タンの時点で部分マイクロパタンをたし合わせる(この
結果をトータルパタンと呼ぶ)手段である。
、音声信号を生成する部分は、従来技術にあるものと同
じであり、トータルパタンと、音源強度パタンと、音素
的パラメータをもとにして合成音声を生成する。
〔作用〕
合成しようとする音声の音素の連なり方に応じて、その
調音様式に対応する部分マイクロパタンが、部分マイク
ロパタンテーブルの中から検索され選び出される。一方
、従来技術と同じ方法によって基本周波数の大きな変化
パタン(マクロパタン)が作成される。そして、従来技
術によって音素の連なりの時点(たとえば、子音と母音
の組である音節の時点)が決まるので、その時点で部分
マイクロパタンをマクロパタンにたし合せる。その結果
、マクロパタンと部分マイクロパタンが合わされたトー
タルパタンが得られ、トータルパタンによって合成音声
の基本周波数が制御される。
最終的に、音声合成装置から出力される合成音声の基本
周波数パタンは、従来技術により生成されたマクロパタ
ンと調音様式に対応して付は加えられた部分マイクロパ
タンが合わさったものとなる。
部分マイクロパタンは、あらかじめ自然音声を分析して
記憶しであるパタンとなっている。
〔実施例〕
部分マイクロパタンとマクロパタンのたし合わせ処理は
、部分マイクロパタンテーブルに記憶しである範囲の時
間長だけ部分マイクロパタンをマクロパタンにたし合わ
せればよく、部分マイクロパタンをたし合わせる必要の
ない期間は、たし合わせる処理自体は不用である。しか
しながら、処理装置の構成上はある時間はたし合わせ処
理を行って、ある時間はたし合わせ処理を行わないとい
うのは、制御が複雑になる。そこで、まず部分マイクロ
パタンを合成しようとする文の時間軸上に配置したパタ
ン(これを全体マイクロパタンと呼ぶ)を用意し、しか
る後に全体マイクロパタンとマクロパタンをたし合わせ
処理を行うというように、処理を2つに分ければ処理の
制御が簡単になる。それを第6図に示す。
まず、説明を簡単にするためCとVの組み合わせ、すな
わちCv音節に対してCからVへの過渡部における部分
マイクロバ、タンテーブルが用意されている場合につい
て説明する。
いま、C+V+の音節に対応する部分マイクロパタンが
第7図(a)(縦軸に対数軸上で表わした基本周波数の
変化量、横軸に時間を示す、以下同じ)に示すG b 
、 (tlの通り、時刻0からl、の長さにわたって固
有Foパタンテーブルに記憶されており、CCVsの音
節に対応する部分マイクロパタンが第7図偽)に示すG
b、(tlの通り時刻0からiの長さにわたって記憶さ
れているとする。そして音節の時点がC+V+はT□、
C8V□はT□になったとする。音節の時点に対応する
ように、部分マイクロパタンを時間軸上に配置すると、
第7図+91のようになる0図中太い線で示した部分、
すなわち、T1からTFI + l t % Tvzか
らT、、+1.は、部分マイクロパタンテーブルに記載
されている内容からそのまま得られる部分であるmTt
+”j!+からT’riの間は未定義になっている部分
である。この未定義の部分は、その前後の部分マイクロ
パタンの端の値を接続する、たとえば直線補間によって
補う、直線補間した結果を第7図(dlに示す。
以上の説明は、C,V、とCtV、の2つの音節が連続
している場合を示した。実際の文章を合成する場合は、
もっと多くの音節が連続しているが、以上の説明と同様
にして各音節に対する部分マイクロパタンをその音節の
時点に配置し、音節の間の未定義な部分は直線補間する
。なお、文と文の間の休止など音声を合成しない期間は
、Poパタンを定める必要がない、そして、各調音様式
に対応する部分マイクロパタンは、自然音声を分析して
あらかじめ部分マイクロパタンテーブルに記憶させるこ
とによって準備しておく、さらに、そのとき自然音声の
分析結果を若干手を加えて、すべての部分マイクロパタ
ンの前端と後端の値が一定値(Gcとする)を持つよう
にしておけば、各音節のマイクロパタンをつなぎ合わせ
名車線補間は、各音節の部分マイクロパタンの間の未定
義な部分をGcに設定する処理でよくなる。
以上の処理によって文の全体マイクロパタンが得られる
。これを以降Gb(tlで示す、 Gb(tlとは別に
、従来技術により文の基本周波数パタンか得られる。
これは、文の大局的な変化パタンなので、マクロパタン
と呼びpm(tlで表す、従来技術で用いている記号で
表わせば、 1nF−(t)−1nl’win + 、Σ^ptGp
(t  −To、  )Iす +ΣAaj (Ga(t−T+j) Ga(t−Tga
))となる、そして、最終的に合成され出力される音声
の基本周波数パタンをFo’ (t)で表わすと、1n
Fo’  (t)= InFs(tl +Gb(t)で
計算する。もちろん、対数軸上で計算しな(でも、 Fo’  (tl−f’5(t)Xexp(Gb(tl
)で計算できるのは言うまでもない。
さらに、G b i (tlをつなぎ合わせてGb(t
)を計算し、その後にexp(Gb(t))を求めるの
ではな(、あらかじめexp(Gbiltl)の値を計
算し記憶しておけば、それをつなぎあわせるだけでex
p(Gb(t))が求まることも言うまでもない、この
ように、計算処理は種々の方法と順序がある。
次に、部分マイクロパタンの記憶容量を減らす方法を説
明する。
部分マイクロパタンG b i (t)は、すべての音
素的特徴量の記憶単位、たとえばCv単位のそれぞれに
対して、固有の値を与えておくこともできる。
しかしながらこの発明に先立って行なわれた分析結果を
もとにすれば、著しく記憶容量を減らすこともできる。
第8図にその方法を示す、CからVへの過渡部における
部分マイクロパタンには、4種類あることは前述した通
りである。これをGbs(tl、G b + (t)、
G b t (t)、Gbs(t)で表す0部分マイク
ロパタンテーブルに記憶するのはGbo(t)、a b
 + tt)、G b * (t)、Gbs(tlであ
る(第8図のF21参照)、実際に記憶する値は、自然
音声の分析して、そのタイプの平均的な部分マイクロパ
タンを求めて記憶する。一方すべての音節に対しては、
それがどのタイプすなわち、Gbsto、G b 、 
+tl、G b 、 (tl、G b 3 (t)のど
れに該当するかを表の形にして記憶しておく(第8図F
22参照)、F22の内容は、実際には、分析結果の際
に紹介した対応表のようになっている。そして、ある音
節に対する部分マイクロパタンを得るとき、たとえば、
第8図においてC,V、に対するマイクロパタンを得る
には、F22により、該当する部分マイクロパタンのタ
イプを得るとタイプ0であることを示しているので、G
bo(tlを用いればよいことがわかる0部分マイクロ
パタンを記憶するのに要する容量は、たとえば、基本周
波数の値を1バイトで表し、100m5ecのわたって
5m5ecごとの値を記憶するとぜんぶで20バイト必
要である。一方F22においては部分マイクロパタンの
種類のみを指定するだけなので、わずか2ビツトで十分
である。よって、最小必要限な種類の部分マイクロパタ
ンのみを記憶するなら、記憶に要する容量をへらすこと
ができる。なお、タイプの部分マイクロパタンGb*(
t)は、はとんど変化のないパタンであるため、定数G
bcで置き換えることもてきる(第9図)、この場合時
間変化パタンとして記憶しておくのは、G b 、 (
t)、Gb律)、Gb!(t)の3種となる。また、よ
り自然音声を忠実に真似しようとするならば、たとえば
タイプ3用の部分マイクロパタンG b 3 (t)を
、より変動の大きなパタンGbst(11と変動の比較
的少ないパタンGbsg(t)に分類して、音節毎に使
いわけることも可能である。
次にFo(tlの計算式の計算法について説明する。
Fo’ (tlの計算式は ■ +Gb(t) である、ここで1nFm1nとG b (tlを先に計
算することにすると、 1nFo’ (t)= (InFmin+Gb(tl)
札ΣApiGp(t−fax)+ ThAaj(Ga(
t−Tlj)−Ga(t−Tx=))  −■j−1 となる* jasminは定数であるので、Gb’ (
tl−1nFmin+Gb(t)と表すことにし、部分
マイクロパタンGb i (t)の代わりにlnFm1
nの定数をあらかじめたした値Gbi’(t)を部分マ
イクロパタンテーブルに記憶しておけば、G b i 
(tlからG b (tlを求めたときの説明と同じ処
理によってGbi’ TtlからGb’ (tlが計算
できる。これにより、■で要したInFm1nとGb(
t)をたす演算を減らすことができ、音声合成処理に要
する演算量を減らすことができる。
以上の例では、Cvの過渡部における部分マイクロパタ
ンを分析の結果得られた4種類のパタンを用意する場合
を示した。しかしながら分析結果におけるタイプ2は、
分析上得られたパタンであり、音声合成の際に用いても
効果が比較的少ないと考えられる。この場合、タイプ2
を示したCv音節に対してはタイプ0を用いればよい、
そうすると、この場合の部分マイクロパタンは次の3つ
である。
■基本周波数が平板(はとんど変化がない)なもの(タ
イプO) ■基本周波がCからVへの過渡部で、下降を行うもの(
タイプl) ■基本周波数がCからVへの過渡部で上昇を行うもの(
タイプ3) また、以上の例では、CからVへの過渡部に対して、部
分マイクロパタンを与える場合を示したがVからCへの
過渡部に対しても、部分マイクロパタンを与えることが
できる。このときのパタンは分析結果から少なくとも次
の2種類を用意しておけばよい。
(i)基本周波数が平板なもの。
(ii )基本周波数がVからCへの過渡部で下降を行
うもの。
である、下降の程度によって、(ii)をさらに、下降
の程度の大きいものと、小さいものに分類して用意して
おいてもよいことは言うまでもない。
なお、■からCへの過渡部の時点は、Cv音節の時点が
定まれば、たとえばC+V+CgVtにおいて、C1v
lとctvtの時点が決まれば、C+Vtの過渡部の時
点が決まるのは言うまでもない。
最後に、設計上の留意事項として、基本周波数に与える
ゆらぎに関して述べる。従来から自然音声の基本周波数
には微小なゆらぎがあることが知られている。また、合
成音声の基本周波数パタンに微小な変化パタン(これを
以後ランダムパタンと呼ぶ)を与え、自然音声のゆらぎ
を模擬することで、自然性が向上することが知られてい
る。
このランダムパタンは、マクロパタンに部分マイクロパ
タンを付加し、トータルパタンを作成した後に、トータ
ルパタンに付加する処理構成も可能である。しかしなが
ら、次のようにするとマイクロパタンに部分マイクロパ
タンを付加する際に、同時にこのランダムパタンを与え
ることができる。
まず、部分マイクロパタンテーブルには、部分マイクロ
パタンにランダムパタンを合わせたパタン(これを、部
分マイクロランダムパタンと呼ぶ)を記憶しておく0次
に全体マイクロパタンを作成する際に部分マイクロパタ
ンを接続する際は、未定義の期間は、線形補間をするか
又は一定値でうめるとなっていたが、部分マイクロラン
ダムパタンを接続する際は未定義の期間は、ランダムパ
タンでうめるようにする。そうすると、部分マイクロラ
ンダムパタンを接続して得られるパタン(これを全体マ
イクロランダムパタンと呼ぶ)は、全体マイクロパタン
にランダムパタンを合わせたものとなる。そうすると、
マクロパタンに全体マイクロランダムパタンを加える処
理で、マクロパタンに全体マイクロパタンとランダムパ
タンを加えることができる。
(L大王余白) 第1表 (al 第2表 〔発明の効果〕 以上のように、この発明によれば比較的少ない記憶容量
及び演算量の増加だけで、調音様式による基本周波数パ
タンの変動を合成音声に付加することができる。これに
より、合成音声の明瞭度の改善や、自然性を高めること
ができるので、音声合成装置の性能を向上するのに役立
つ。
【図面の簡単な説明】
第1図は、従来技術による音声合成装置の処理構成図、
第2図はF0パタン生成モデルを示す図、第3図は音声
波形とP、パタンの分析例を示す図、第4図は、分析し
て得られた4タイプのFoパタンを示す図、第5図は、
本発明による音声合成装置の処理構成図、第6図は、本
発明による音声合成装置の処理の実施例を示す図、第7
図は、文のイ体マイクロパタンを作成する処理の説明図
であ番(a)図とib1図は、C■音節に対する部分マ
イクロノタン、(C1図は部分マイクロパタンを時間軸
上にr置した状況の説明図、(61図は(C)図の部分
マイク−パタンの接続の説明図、第8図は、CV音節に
りして4つの部分マイクロパタンを使用する方法C説明
図、第9図は、タイプ0を定数に置き換えlときの説明
図である。 特許出願人  住友電気工業株式会社 同     応   崎   博   世間 代理人 
 鎌  1) 文  二 第7図 (a)         (b) 第8図 F22      F21 第9図

Claims (6)

    【特許請求の範囲】
  1. (1)文字・記号等を入力とし音声を合成する音声合成
    装置において、 入力中にある韻律記号により、又は入力に基づき内蔵さ
    れた辞書を検索することにより、韻律的特徴量を得て、
    合成しようとする音声の基本周波数の大きな変化パタン
    (これをマクロパタンと呼ぶ)を生成する基本周波数生
    成部と、 音素の組み合わせに対応して、基本周波数の小さな変化
    パタン(これを部分マイクロパタンと呼ぶ)を記憶する
    記憶部(これを部分マイクロパタンテーブルと呼ぶ)と
    、 前記マイクロパタンを、合成しようとする音声に出現す
    る音素に対応して部分マイクロパタンテーブルから選び
    出す手段と、 マクロパタンと部分マイクロパタンを合わせる手段を有
    し、 マクロパタンと部分マイクロパタンを合わせた結果(こ
    れをトータルパタン)によって合成しようとする音声の
    基本周波数を制御することを特徴とする音声合成装置。
  2. (2)特許請求の範囲第1項の音声合成装置において、
    対数軸上におけるマクロパタンの変化パタンが、臨界制
    動二次線形系のインパルス応答を近似した成分と、ステ
    ップ応答を近似した成分の和で表わせることを特徴とす
    る音声合成装置。
  3. (3)特許請求の範囲第1項又は第2項に記載の音声合
    成装置において、対数軸上におけるトータルパタンが、
    マクロパタンと部分マイクロパタンの和で表わせること
    を特徴とする音声合成装置。
  4. (4)特許請求の範囲第1項、第2項又は第3項に記載
    の音声合成装置において、部分マイクロパタンが、子音
    (以下Cで略記)と母音(以下Vで略記)の連鎖に対し
    ては、 基本周波数が平板であるものと、 基本周波数がCからVへの過渡部に対して下降を行うも
    のと、 基本周波数がCからVへの過渡部に対して上昇を行うも
    のの、 3つあることを特徴とする音声合成装置。
  5. (5)特許請求の範囲第1項から第4項のいずれかに記
    載の音声合成装置において、部分マイクロパタンがVC
    の連鎖に対しては、 基本周波数が平板であるものと、 基本周波数がVからCへの過渡部に対して下降を行うも
    のの、 2つあることを特徴とする音声合成装置。
  6. (6)特許請求の範囲第1項から第5項のいずれかに記
    載の音声合成装置において、マクロパタンと部分マイク
    ロパタンを合わせる手段が、 部分マイクロパタン同士を合成しようとする音声中の出
    現順序と時点に対応して接続する(この処理により得ら
    れるパタンを全体マイクロパタンと呼ぶ)部分と、 全体マイクロパタンとマクロパタンの合わせ部分から成
    り立つことを特徴とする音声合成装置。
JP23222886A 1986-09-30 1986-09-30 音声合成装置 Pending JPS6385799A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP23222886A JPS6385799A (ja) 1986-09-30 1986-09-30 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP23222886A JPS6385799A (ja) 1986-09-30 1986-09-30 音声合成装置

Publications (1)

Publication Number Publication Date
JPS6385799A true JPS6385799A (ja) 1988-04-16

Family

ID=16935982

Family Applications (1)

Application Number Title Priority Date Filing Date
JP23222886A Pending JPS6385799A (ja) 1986-09-30 1986-09-30 音声合成装置

Country Status (1)

Country Link
JP (1) JPS6385799A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002091474A (ja) * 2000-09-05 2002-03-27 Lucent Technol Inc 非言語依存韻律マークアップを用いてテキストからスピーチに処理する方法および装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS616693A (ja) * 1984-06-20 1986-01-13 株式会社日立製作所 アクセント決定方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS616693A (ja) * 1984-06-20 1986-01-13 株式会社日立製作所 アクセント決定方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002091474A (ja) * 2000-09-05 2002-03-27 Lucent Technol Inc 非言語依存韻律マークアップを用いてテキストからスピーチに処理する方法および装置
JP2013011902A (ja) * 2000-09-05 2013-01-17 Alcatel-Lucent Usa Inc 非言語依存韻律マークアップを用いてテキストからスピーチに処理する方法および装置

Similar Documents

Publication Publication Date Title
US6064960A (en) Method and apparatus for improved duration modeling of phonemes
JP3720136B2 (ja) ピッチ輪郭を決定するためのシステムおよび方法
EP0427485B1 (en) Speech synthesis apparatus and method
JP3361066B2 (ja) 音声合成方法および装置
JPH086591A (ja) 音声出力装置
JPH01284898A (ja) 音声合成方法
JPS6385799A (ja) 音声合成装置
JP3344487B2 (ja) 音声基本周波数パターン生成装置
JPH0580791A (ja) 音声規則合成装置および方法
JP2001100777A (ja) 音声合成方法及び装置
JP3485586B2 (ja) 音声合成方法
JPH056191A (ja) 音声合成装置
JP3318290B2 (ja) 音声合成方法および装置
JPH09146576A (ja) 原文対音声の人工的神経回路網にもとづく韻律の合成装置
Eady et al. Pitch assignment rules for speech synthesis by word concatenation
JPH04149500A (ja) テキスト音声合成装置
JPH0727392B2 (ja) 音声合成装置
JP2573587B2 (ja) ピッチパタン生成装置
JP2004206144A (ja) 基本周波数パタン生成方法、及びプログラム記録媒体
JPS63174100A (ja) 音声規則合成方式
JPH02113299A (ja) 基本周波数パタン生成装置
Ding et al. Natural tone contours in a mandarin chinese speech synthesizer
JPH0756591A (ja) 音声合成装置、音声合成方法及び記録媒体
JPH0378800A (ja) 音声規則合成方式
JPH06138894A (ja) 音声合成装置及び音声合成方法