JPH04149500A - テキスト音声合成装置 - Google Patents

テキスト音声合成装置

Info

Publication number
JPH04149500A
JPH04149500A JP2274369A JP27436990A JPH04149500A JP H04149500 A JPH04149500 A JP H04149500A JP 2274369 A JP2274369 A JP 2274369A JP 27436990 A JP27436990 A JP 27436990A JP H04149500 A JPH04149500 A JP H04149500A
Authority
JP
Japan
Prior art keywords
syllable
duration
continuance
speech
membership function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2274369A
Other languages
English (en)
Inventor
Osamu Kimura
治 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2274369A priority Critical patent/JPH04149500A/ja
Publication of JPH04149500A publication Critical patent/JPH04149500A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は漢字仮名交じり文等のテキストから合成音声を
生成するテキスト音声合成装置に関する。
〔従来の技術〕
テキスト音声合成において高品質な合成音声をうるため
には、韻律情報である音韻継続時間長の制御規則の高度
化が必要である。従来から行われている音韻継続時間長
の制御は、例えば「匂坂芳典、東倉洋−“音韻固有の性
質を考慮した音韻継続時間長設定”音声研究会880−
724  がある。
この規則は音韻長設定に用いる各種固有量として以下の
ものを用い、母音長1vと子音長Lcを算出する。
(a)各子音毎の基本長1/c/ (b)各子音の先行および後続母音基本長:tp/c/
11/c/ (C)各子音固有の圧縮係数: p/c/(d)v−c
およびc−v補償係数: Up/c/、Ur/c/(e
)各母音の基本長比二λ/v/ (f) Nモーラ呼気段落表内の平均音節長:t(N)
母音長Lv=λ/v/X(wXtp/cl/+(1−w
)XZf/c2/I)+ (wXLIp/c I/+ 
(1−w ) XU f/c 2/) X(t(N) 
−L(No ))1・・・(1) 子音長tc=t/c/+p/c/X(4N)−t(No
))    −(2)但しcI:先行子音、C2:後続
子音、V;母音、Wは0≦W≦1の定数で通常は0.5
、NOは定数で通常は4である。
すなわち、この設定規則は呼気段落がNOモーラの場合
の各音韻の基本長を基準にしており、発声モーラ数の違
う場合には、呼気段落内の平均音節長: t(N)と、
子音と母音の変動量を表す圧縮係数:p/c/を用いて
継続長を算出している。
〔発明が解決しようとする課題〕
ところがこの方法では、基本長よりも速くなる場合と遅
くなる場合に関係なく線形に子音と母音を伸縮させるこ
とになり、発声が遅い場合、子音時間長よりも母音時間
長を伸ばすことによって発声するという実際に観察され
る自然音声きは一致しない。1だ、自然音声では音韻毎
に継続長の上限と下限があり、それは統計的にも求まる
が、上記の規則では各音韻がその範囲に収まる補償がな
いので、その範囲から逸脱する場合があり、合成音声の
自然性を悪くしていた。そのため、発声速度別に場合わ
けして上記の固有量を持ったり、各音韻が自然音声の継
続長から極端に外れないようにチエツクする必要があり
、その結果、蓄えておくデータの量が増え、アルゴリズ
ムも複雑になる傾向があった。
本発明は上記の問題点に鑑みてなされたものであって、
比較的簡便な構成で自然な合成音声を得ることのできる
テキスト音声合成装置を提供することを目的とする。
〔課題を解決するための手段〕
上述の目的を達成するために本発明に係るテキスト音声
合成装置は、韻律的な環境に応じた■モーラあたりの継
続時間長の出現確率を表す第1のメンバシップ関数を求
める手段と、音韻的な環境に応じた音節の継続時間長の
出現確率を表す第2のメンバシップ関数を求める手段と
、前記第1と第2とのメンバシップ関数を合成すること
によって音節の継続時間長を算出する手段と、音節内の
子音と母音との継続時間長を表わすテーブルから前記音
節の継続時間長に基づいて音素の継続時間長を求める手
段とを有する韻律処理部を備えたことを特徴とする。
〔作 用〕
第6図を用いて基本的な考え方を説明する。第6図は、
ある要因Aと、要因Bによる継続長の頻度分布である。
要因A2、要因Bから継続長を算出する場合、第6図で
両者が交わっている0点からd点までの縞線の部分の最
大値となるe点を継続長とする。なお、この0点からd
A″1での範囲は音声を発声する際のバラツキまたは他
の要因による発声変動と考える事が出来、要因を追加す
るに従ってこの範囲は小さくなる。
〔実施例〕
以下、本発明を参照しながら説明する。
第1図は、この発明にかかるテキスト音声合成装置のブ
ロック図である。第1図において10は音声合成すべき
漢字仮名交じり文の入力される入力部、1■は制御部、
12は音声パラメータに従って音声の合成を行いこれを
出力する音声合成部、13は音声合成部12からの合成
音声信号を出力する出力部、I4は日本語辞書及び漢字
辞書用メモリ、15は韻律制御用メモリ、16は音声デ
ータ辞書用メモリをそれぞれ示している。これら入力部
10、制御部II、音声合成部f2及びメモリ14.1
5.16はパス17を介して互いに接続されている。
制御部I+は、プログラムされたコンピュータで主とし
て構成されており、後述するごとく、入力部10から入
力された入力データからメモリ14.15.16を用い
て音声パラメータを生成する。
第2図は、特にこの制御部1■の機能的構成を詳しく表
すブロック図である。入力部10から与えられる漢字仮
名交じり文は、文字列解析部20内の単語分割処理部2
11C印加される。このとき同時に合成音の発声速度を
指定した制御コードも入力部10に入力され、そのまま
韻律処理部23に送られている。単語分割処理部21に
おいて漢字仮名交じり文は、日本語辞t14を参照し、
公知の最長−散性又は文中の文節数が最小となるように
単語を選択する文節数最小法等を用いて各単語に分割さ
れる。日本語辞書+4VCは、単語毎に品詞、読み、モ
ーラ数、及びアクセント等があらかじめ格納されている
。そして、この分割された単語は、単語読みアクセント
処理部22で単語毎にアクセント型と読みを与えられ、
韻律処理部23へ出力される。
韻律処理部23では、単語読みアクセント処理部から得
られる各単語のアクセントから、公知の方法で単語が連
鎖した際の文節のアクセント及び呼気段落間のポーズの
設定を行い、後述する方法で音韻継続長を算出した後、
ピッチバタン設定を行う。
続いて音声パラメータ生成部24では、合成用単位の音
声データ辞書16を参照して各単語の読みに対応する合
成単位が検索され、゛最終的に音声合成用の音声パラメ
ータの時系列が得られる。
次に、韻律処理部23での音韻継続長決定アルゴリズム
について第3図を用いて説明する。
ステップSOで呼気段落の文字列A(i)(iはモーラ
番号)、発話速度を入力する。
ステップS1でA(i)のモーラ数mを算出し、mモー
ラの呼気段落の場合の1モーラあたりの継続時間長頻度
分布をあられすメンバシップ関数m (x)を韻律制御
用メモリ15から抽出する。なお、変数Xは継続時間長
を表している。
ステップS2で発声速度毎に場合分けした1モーラあた
りの継続時間長頻度分布をあられすメンバシップ関数s
 (x)を韻律制御用メモリ+5から抽出する。
ステップS3でモーラ番号のポインターであるjを1に
する。
ステップS4で発話内位置を語頭、語中、語尾で場合分
けした1モーラあたりの継続時間長頻度分布をあられす
メンバシップ関数h (x)を韻律制御用メモリ15か
ら抽出する。尚、j=1のとき語頭、1<j<mのとき
語中、j=mのときは語尾である。
ステップS5でステップSl、S2、S4で抽出したメ
ンバシップ関数の、共通集合の関数f (x)を次式で
算出する。
f (x)= m(x)八5(x)△h(x)  =1
3)ここで、△はminを表し、このf (x)が韻律
的な環境に応じた1モーラあたりの継続時間長の出現確
率を表すメンバシップ関数である。例えば、第4図に示
すようVCm(x) 、 s (x) 、 h (x)
があるとすると、f (x)は、太線内になる。
ステップS6でA(i)の各子音及び各母音固有の継続
時間長頻度分布をあられすメンバシップ関数tべxf)
・tv(X2)を抽出する。
ステップS7でtc(xc)とtv(xv)の合成関数
!Ax)を次式で算出する。
t(x)= t(ycc+xv)=(4c(xc)△t
v<xv>1−(4)ここで、△はmin、 Vはma
xSxcは子音継続時間長、XVは母音継続時間長、X
は音節継続時間長を表し、x=xc+xvである。また
、(4)式は、ファジー数でいう足し算であり、Xの値
に応じて最も出現確率の高いxcとzvの組合せを求め
ている。そしてこのL (x)は音韻的な環境に応じた
音節の継続時間長の出現確率を表すメンバシップ関数を
表している。この(4)式を簡単に説明するために、例
えば次表に示すように tc(XC)とtv(xv)が離散的に存在していたと
する。この場合、Xの範囲はm1n(xc+xv)=5
からmax(xc+xvl =9までである。そして各
Xに対するt(x)を算出するのだが、x = 5の場
合、xc=2:xv=3の場合だけなので45)=mi
n(な2)、を式3))=min(0,2、0,81=
 0.2となる。x = 6の場合、xc=2・xv=
=4とxc=8・xv=8の2通りがあるが、A6’P
 max(m in (tc(2) 、 tv(4) 
)、 m in [tc(8) 、 tvf3) ) 
1=max(min(0,2、0,4)、 m1n(0
,5、0,f3 ]1=m4x[0,2、0,3) =
 0.3であるから、xc==3・xv=3カ(x=6
のときの剥続時間長となり、その頻度は0.3である。
このような処理をXの範囲内に対して行っl結果、表に
示すような各Xに対するt(X)+ xc 、 X・が
得られる。ただし、t(8)の場合のように、xcとx
vの組合せが複数存在するときは、どち(を用いても合
成音声に影響はない。そして、これらを韻律制御メモリ
に一時的に蓄える。
ステップS8でステップS5、S7で算出し力メンバシ
ップ関数f (x)、l (x)の共通集合の関数g 
(x)を次式で算出する。
g(x)=f(x)At(x)   −(5)ここで、
△はminを表す。第5図に示すようにf (x)とべ
X)が存在したとすると、太線内がg(x)となる。但
しg(x)=■(空集合)の場合、g(x) =aX>
とする。
ステップS9でg(x)が最大値となるXを音節の継続
長とし、ステップS7で算出したxVC対するxl、x
2の値を子音及び母音の継続長にする。たとえばx =
 6のときVCg(x)が最大であれば、表より子音=
3、母音=3となる。ただし、g(x)からXを算出す
る方法は、g (x)の重心となるXを用いても良い。
ステップSIOでモーラ番号jをインクリメントする。
ステップS11でもし55mであればステップS4から
ステップ510の処理を繰り返す。
以上の処理により、韻律の制御を行う。
このように処理をすると、継続長を決定する各要因の重
要度がメンバシップ関数で表されるため、簡単なアルゴ
リズムで自然音声に近い継続長を制御することが可能と
なる。
〔発明の効果〕
以上詳細に説明したように本発明のテキスト音声合成装
置によれば、各種の要因を組み合せた場合の頻度分布か
ら継続長を算出するため、自然音声の継続長の範囲から
外れることはない。又、従来の規則では子音と母音で算
出に用いる要因が異なっていたが、本発明では要因毎の
メンバシップ関数が継続長を決定する重みを自動的に与
えるため、子音と母音を区別する必要がなくアルゴリズ
ムも複雑にならない。また要因の追加や削除も容易に行
うことが出来る。したがって、自然音声に近い継続長を
持った自然性の高い合成音声を得ることができるテキス
ト音声合成装置を提供することができる。
【図面の簡単な説明】
第1図は本発明の一実施例の構成を概略的に示すブロッ
ク図、第2図は制御部の機能的構成を詳しく表すブロッ
ク図、第3図は継続長算出処理の一例のプログラムのフ
ローチャートである。第4図、第5図は、継続長算出処
理の処理例を示す為の模式図、第6図は継続長制御の考
え方を説明する説明図である。 10・・・日本語文人力部、1■・・・制御部、f2・
・・音声合成部、13・・・出力部、】4・・・日本語
辞書、+5・・・韻律制御用メモリ、+6・・・音声デ
ータ辞書用メモリ、】7・・・バス、21・・・単語分
割処理部、22・・・単語読みアクセント処理部、23
・・・韻律処理部、24・・・音声パラメータ生成部。 代理人 弁理士 梅 1) 勝(他2名)翅騒灸X 114図 *、*表X

Claims (1)

  1. 【特許請求の範囲】 1、任意の文字列から音声合成を行うテキスト音声合成
    装置において、 韻律的な環境に応じた1モーラあたりの継続時間長の出
    現確率を表す第1のメンバシップ関数を求める手段と、 音韻的な環境に応じた音節の継続時間長の出現確率を表
    す第2のメンバシップ関数を求める手段と、 前記第1と第2とのメンバシップ関数を合成することに
    よって音節の継続時間長を算出する手段と、 音節内の子音と母音との継続時間長を表わすテーブルか
    ら前記音節の継続時間長に基づいて音素の継続時間長を
    求める手段と を有する韻律処理部を備えたことを特徴とするテキスト
    音声合成装置。
JP2274369A 1990-10-11 1990-10-11 テキスト音声合成装置 Pending JPH04149500A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2274369A JPH04149500A (ja) 1990-10-11 1990-10-11 テキスト音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2274369A JPH04149500A (ja) 1990-10-11 1990-10-11 テキスト音声合成装置

Publications (1)

Publication Number Publication Date
JPH04149500A true JPH04149500A (ja) 1992-05-22

Family

ID=17540700

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2274369A Pending JPH04149500A (ja) 1990-10-11 1990-10-11 テキスト音声合成装置

Country Status (1)

Country Link
JP (1) JPH04149500A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006215110A (ja) * 2005-02-01 2006-08-17 Nippon Hoso Kyokai <Nhk> 継続時間長生成装置及び継続時間長生成プログラム
JP2006313274A (ja) * 2005-05-09 2006-11-16 Nhk Computer Service:Kk 番組音声制作装置および番組音声制作プログラム
JP2007114794A (ja) * 2005-10-20 2007-05-10 Toshiba Corp 時間長予測モデルをトレーニングする方法及び装置、時間長予測方法及び装置並びに音声合成方法及び装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006215110A (ja) * 2005-02-01 2006-08-17 Nippon Hoso Kyokai <Nhk> 継続時間長生成装置及び継続時間長生成プログラム
JP4603375B2 (ja) * 2005-02-01 2010-12-22 日本放送協会 継続時間長生成装置及び継続時間長生成プログラム
JP2006313274A (ja) * 2005-05-09 2006-11-16 Nhk Computer Service:Kk 番組音声制作装置および番組音声制作プログラム
JP4537886B2 (ja) * 2005-05-09 2010-09-08 株式会社エヌエイチケイメディアテクノロジー 番組音声制作装置および番組音声制作プログラム
JP2007114794A (ja) * 2005-10-20 2007-05-10 Toshiba Corp 時間長予測モデルをトレーニングする方法及び装置、時間長予測方法及び装置並びに音声合成方法及び装置
JP4602307B2 (ja) * 2005-10-20 2010-12-22 株式会社東芝 時間長予測モデルをトレーニングする方法及び装置、時間長予測方法及び装置並びに音声合成方法及び装置

Similar Documents

Publication Publication Date Title
US6470316B1 (en) Speech synthesis apparatus having prosody generator with user-set speech-rate- or adjusted phoneme-duration-dependent selective vowel devoicing
JP4302788B2 (ja) 音声合成用の基本周波数テンプレートを収容する韻律データベース
JP2000163088A (ja) 音声合成方法および装置
JPH0632020B2 (ja) 音声合成方法および装置
JPH04149500A (ja) テキスト音声合成装置
JPH0580791A (ja) 音声規則合成装置および方法
JPS5972494A (ja) 規則合成方式
JPS62138898A (ja) 音声規則合成方式
JP3113101B2 (ja) 音声合成装置
JPH0887289A (ja) 音声規則合成装置
JPH037995A (ja) 歌音声合成データの作成装置
JP3235747B2 (ja) 音声合成装置及び音声合成方法
JP3614874B2 (ja) 音声合成装置及び方法
JP2006227367A (ja) 音声合成装置
JP3314116B2 (ja) 音声規則合成装置
JPS62284398A (ja) 文・音声変換装置
JPH01321496A (ja) 音声合成装置
JP3318290B2 (ja) 音声合成方法および装置
Deng et al. Speech Synthesis
JPH0378800A (ja) 音声規則合成方式
JPH0990971A (ja) 音声合成方法
JPH09292897A (ja) 音声合成装置
JP3313310B2 (ja) 音声合成装置及び合成方法
JPH0876782A (ja) 音声合成装置
Ahmad et al. Towards designing a high intelligibility rule based standard malay text-to-speech synthesis system