JP2702919B2

JP2702919B2 - 文−音声変換装置

Info

Publication number: JP2702919B2
Application number: JP62058622A
Authority: JP
Inventors: 達郎松本; 晋太木村
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1987-03-13
Filing date: 1987-03-13
Publication date: 1998-01-26
Anticipated expiration: 2013-01-26
Also published as: JPS63223792A

Description

【発明の詳細な説明】〔目次〕概要産業上の利用分野従来の技術発明が解決しようとする問題点問題点を解決するための手段作用実施例 I.実施例と第１図との対応関係 II.実施例の構成 III.実施例の動作（ｉ）乱数発生器による音韻仮説の選択（ii）カウンタによる音韻仮説の選択 IV.実施例のまとめ V.発明の変形態様発明の効果〔概要〕文−音声変換装置であって、文字列に対応して、仮説
生成手段で少なくとも１つの音韻仮説とその出現確率を
出力し、仮説限定手段でその中から１つを選択して音韻
記号列を出力することにより、自然性の高い合成音声の
生成が可能となる。〔産業上の利用分野〕本発明は、文−音声変換装置に関し、特に、入力され
た文字列に対応して、自然性の高い音声出力を得るため
の文−音声変換装置に関するものである。〔従来の技術〕一般に、文−音声変換装置は、翻訳電話，コンピュー
タの音声出力装置，盲人用読書器等に利用されている。第６図は、一般的な文−音声変換装置の構成を示す。
図において、音韻記号生成部711には、文字列が入力さ
れ、変換ルールａ格納部731に格納された文字列−音韻
記号変換ルールに基づいて、音素環境などを考慮した音
韻記号列を作成する。例えば日本語において、音素/N/
は、置かれた環境によって、音韻〔ｍ〕，〔ｎ〕，
〔η〕になる。音声パラメータ生成部261には、音韻記
号生成部711で作成された音韻記号列が入力され、変換
ルールｂ格納部271に格納された音韻記号−パラメータ
変換ルールに基づいて、音声パラメータを作成する。音
声合成部281は、音声パラメータに基づいて音声を出力
する。〔発明が解決しようとする問題点〕ところで、上述したように、置かれた環境によって必
ず音素変形が生じる場合、その変形した音素を条件異音
と言う。一方、ある環境で音素変形が生じたり、生じなかった
りする場合があり、そのときの変形した音素を自由異音
と言う。例えば日本語において、無声子音に囲まれた母
音は、無声化したりしなかったりする。これは、個人的
要因，発生速度，意味等に依存するものであるが、一義
的に決められるものではない。上述した従来方式にあっては、１つの文字列に対し
て、それに対応する音韻記号が一義的に決定されるため
に、実際の発生に現れる自由異音のようなゆらぎを得る
ことはできなかった。そのため、同じ文を音声に変換す
る場合、常に同じ音声になってしまい、自然性に欠ける
という問題点があった。本発明は、このような点にかんがみて創作されたもの
であり、自然性の高い合成音声の生成が可能となるよう
にした文−音声変換装置を提供することを目的としてい
る。〔問題点を解決するための手段〕第１図は、本発明の文−音声変換装置の原理ブロック
図である。図において、入力された文章に応答して音声を出力す
る文−音声変換装置における音素変形ルール格納手段13
1は、文字に対応する音素変形ルールを格納している。仮説生成手段111は、文字列が導入され、音素変形ル
ールに基づいて、該文字列に対応した少なくとも１つの
音韻仮説と出現確率を出力する。仮説限定手段151は、仮説生成手段111から出力された
出現確率に基づいて、音韻仮説の中の１つを選択して音
韻記号列を出力する。従って、全体として、文字列に対応した音韻記号列を
出力するように構成されている。〔作用〕仮説生成手段111には文字列が導入され、音素変形ル
ール格納手段131に格納されている各文字に対応する音
素変形ルールに基づいて、文字列に対応する少なくとも
１つの音韻仮説と出現確率を出力する。仮説限定手段151は、仮説生成手段111から出力された
出現確率に基づいて、音韻仮説の中の１つを選択して音
韻記号列を出力する。本発明にあっては、仮説生成手段111から出力される
少なくとも１つの音韻仮説の中から、それぞれの出現確
率に基づいて１つを選択して、音韻記号列を出力するこ
とにより、自然性の高い合成音声の生成が可能となる。〔実施例〕以下、図面に基づいて本発明の実施例について詳細に
説明する。第２図は、本発明の一実施例における文−音声変換装
置の全体構成を示す。 I.実施例と第１図との対応関係ここで、本発明の実施例と第１図との対応関係を示し
ておく。仮説生成手段111は、仮説生成部211に相当する。音素変形ルール格納手段131は、変形ルール格納部231
に相当する。仮説限定手段151は、仮説限定部251に相当する。以上のような対応関係があるものとして、以下本発明
の実施例について説明する。 II.実施例の構成第２図において、仮説生成部211は、文字列が入力さ
れ、各文字に対応した音韻とその出現確率を変形ルール
格納部231から読み出して、音韻仮説及びその出現確率
を出力する。尚、１つの文字列に複数の自由異音が存在
すると、仮説生成部211で作成される音韻仮説の数は、
それらの積となる。仮説限定部251は、仮説生成部211から出力された出現
確率に基づき、音韻仮説の中から１つを選択して、音韻
記号列を出力する。音声パラメータ生成部261には、仮
説限定部251からの音韻記号列が入力され、変換ルール
ｂ格納部271に格納された音韻記号−パラメータ変換ル
ールに基づいて、音声パラメータを作成する。音声合成部281は、音声パラメータに基づいて音声を
出力する。第３図は、第２図の仮説限定部251の具体的な回路例
を示す。図において、乱数発生器351は、仮説生成部211
からの仮説選択信号が入力されると乱数を発生して、４
つのコンパレータ352〜355の各入力端１に入力する。コ
ンパレータ352〜355の各入力端２には、仮説生成部211
からの各音韻仮説の出現確率が入力される。なお、コン
パレータ353の入力端２へは、コンパレータ352に入力さ
れる１番目の音韻仮説の出現確率と２番目の音韻仮説の
出現確率とを加算器362で加算して入力する。同様に、
コンパレータ354の入力端２へは、コンパレータ353に入
力される出現確率と３番目の音韻仮説の出現確率とを加
算器363で加算して入力する。コンパレータ355の入力端
２へは、コンパレータ354に入力される出現確率と４番
目の音韻仮説の出現確率とを加算器364で加算して入力
する。コンパレータ352〜355のそれぞれは、（入力端１から
のデータ）≦（入力端２からのデータ）のときに“1"を
出力する。コンパレータ352の出力は、エクスクルーシブオアゲ
ート356の一方の入力端に入力される。コンパレータ353
の出力は、エクスクルーシブオアゲート356の他方の入
力端及びエクスクルーシブオアゲート357の一方の入力
端に入力される。コンパレータ354の出力は、エクスク
ルーシブオアゲート357の他方の入力端及びエクスクル
ーシブオアゲート358の一方の入力端に入力される。コ
ンパレータ355の出力は、エクスクルーシブオアゲート3
58の他方の入力端に入力される。３つのエクスクルーシブオアゲート356〜358の出力
は、エンコーダ359に入力され、エンコーダ359では音韻
仮説を指定するためのアドレスを出力する。仮説テーブル360は、仮説生成部211で作成された音韻
仮説を格納し、エンコーダ359で指定されたアドレスに
対応した音韻仮説を出力し、レジスタ361に保持する。第４図は、第２図の仮説限定部251の別回路例を示
す。図に示す回路は、第３図の乱数発生器351をカウン
タ451に置き換えたものであるので、カウンタ451につい
て説明する。カウンタ451は、加算器471,レジスタ472,
コンパレータ473で構成されている。仮説生成部211からの仮説選択信号は、レジスタ472に
入力される。レジスタ472に格納されたデータが読み出
されると、コンパレータ352〜355に入力されると共に、
コンパレータ473の一方の入力端及び加算器471の一方の
入力端に入力される。加算器471の他方の入力端には、
所定の定数が入力され、加算器471の出力はレジスタ472
に書き込まれる。コンパレータ473の他方の入力端に
は、所定の数字（例えば“100"）が入力され、コンパレ
ータ473からの出力はリセット信号として、レジスタ472
に入力される。 III.実施例の動作第５図（イ）は、変形ルール格納部231に格納された
母音“i"の音素変形ルールを示す。図において、矢印の
左側は変換対象を示しており、右側は変換結果を示して
いる。更に、スラッシュ（／）の右側は変換対象の環境
を示している。また、は無声化したｉを、〔−voc〕は無声を示す属性を、＃
＃は単語境界を、＋＋は意味の切れ目の形態素境界を表
している。また、アンダーラインは変形対象の存在場所
を示している。変形対象として“i"を考えた場合、無声子音に囲まれ
た“i"は、無声化する確率が30％であり、また、“i"の
次が単語あるいは意味の切れ目になるときは、無声化す
る確率が20％である。第５図（ロ）は、第５図（イ）のルールに基づく、文
字列“SHIKASHI（しかし）”の音韻仮説の作成例を示
す。“SHIKASHI"には、母音“i"が２つ使用されている
ので、それぞれについて無声化する場合としない場合が
考えられ、全体としては４通りの音韻仮説が考えられ
る。また、乱数範囲内に、発生した乱数が存在するとき
に、その音韻仮説を選択する。尚、音韻仮説は発音記号
で記述した。いま、文字列として“SHIKASHI"を考え、文字列中の
２つの母音“i"のみが無声化したりしなかったりするも
のとする。また、第２図の仮説限定部251の回路とし
て、乱数発生器351を使用した回路（第３図）とカウン
タ451を使用した回路（第４図）を分けて説明する。以下、第２図〜第５図を参照する。（ｉ）乱数発生器による音韻仮説の選択最初に、仮説生成部211に文字列“SHIKASHI"が入力さ
れる。仮説生成部211は、文字列中の最初に現れる母音
“i"が無声子音に囲まれているので、変形ルール格納部
231に格納された音素変形ルールに基にして、無声化す
る確率が30％，無声化しない確率が70％であることを読
み出す。同様に、文字列中の２番目に現れる母音“i"が
単語境界なので、無声化する確率が20％，無声化しない
確率が80％であることを読み出す。次に、仮説生成部211は、変形ルール格納部231から読
み出した確率を基にして、文字列“SHIKASHI"の音韻仮
説とその出現確率を求めて出力する。音韻仮説の１つとしては、２つの母音“i"が共に無声
化する場合が考えられ、それぞれの母音“i"の無声化の確率が30％
と20％であるから、２つの母音“i"が共に無声化する確
率は６％となる。同様に、最初の母音“i"が無声化し、２番目の母音
“i"が無声化しない場合の確率は24％となる。最初の母音“i"が無声化しない
で、２番目の母音“i"が無声化する場合の確率は14％となる。２つの母音“i"が共に無声化する
場合（音韻仮説〔∫ika∫ｉ〕）の確率は56％となる。仮説生成部211は、上述の音韻仮説とその出現確率と
共に仮説選択信号を仮説限定部251に出力する。仮説生成部211からの音韻仮説は、仮説テーブル360に
格納される。複数の音韻仮説の出現確率は、コンパレータ352〜355
に入力される。文字列“SHIKASHI"の場合の２つの“i"
が無声化する確率は６％なので、“6"がコンパレータ35
2及び加算器362に入力される（図中P1）。同様に、最初
の“i"のみが無声化する確率は24％なので、“24"が加
算器362に入力される（図中P2）。加算器362では、入力
された“6"と“24"とを加算し、加算結果“30"をコンパ
レータ353及び加算器363に入力する。２番目の“i"のみが無声化する確率は14％なので、
“14"が加算器363に入力される（図中P3）。加算器363
では、入力された“14"と“30"とを加算し、加算結果
“44"をコンパレータ354及び加算器364に入力する。２つの“i"が無声化しない確率は56％なので、“56"
が加算器364に入力される（図中P4）。加算器364では、
入力された“44"と“56"とを加算し、加算結果“100"を
コンパレータ355に入力する。乱数発生器351には、音韻仮説とその出現確率が入力
されると共に仮説選択信号が入力され、乱数発生器351
はそれを受けて１〜100の範囲内で乱数を発生する。発
生した乱数（例えば“20"）は、コンパレータ352〜355
の入力端１に入力される。コンパレータ352は、入力端２に“6"が入力されてお
り、（入力端１からのデータ“20"）＞（入力端２から
のデータ“6"）なので、“0"を出力する。出力データ
は、エクスクルーシブオアゲート356に入力される。同様に、コンパレータ353は、入力端２に“30"が入力
されており、（入力端１からのデータ“20"）＜（入力
端２からのデータ“30"）なので、“1"を出力する。出
力データは、エクスクルーシブオアゲート356及びエク
スクルーシブオアゲート357に入力される。コンパレータ354は入力端２に“48"が入力されてお
り、（入力端１からのデータ“20"）＜（入力端２から
のデータ“48"）なので、“1"を出力する。出力データ
は、エクスクルーシブオアゲート357及びエクスクルー
シブオアゲート358に入力される。コンパレータ355は、入力端２に“100"が入力されて
おり、（入力端１からのデータ“20"）＜（入力端２か
らのデータ“100"）なので、“1"を出力する。出力デー
タは、エクスクルーシブオアゲート358に入力される。エクスクルーシブオアゲート356は、２つの入力デー
タ（“0"と“1"）の排他的論理和をとって“1"を出力す
る。同様に、エクスクルーシブオアゲート357は、２つ
の入力データ（“1"と“1"）の排他的論理和をとって
“0"を出力する。エクスクルーシブオアゲート358は、
２つの入力データ（“1"と“1"）の排他的論理和をとっ
て“0"を出力する。エクスクルーシブオアゲート356〜358の出力データ
“100"は、エンコーダ359に入力される。エンコーダ359
は、仮説テーブル360の２番目の音韻仮説が格納されているアドレスを出力する。仮説テーブル360からは、エンコーダ359でアドレスを
指定したデータが読み出されてレジスタ361に保持され
る。なお、上述では乱数を“20"とし、２番目の音韻仮説
の範囲（７〜30）内の値を考えたが、乱数が１番目の音
韻仮説の範囲（１〜６）内であれば、エクスクルーシブ
オアゲート356〜358からは“000"が出力される。同様
に、乱数が３番目の音韻仮説の範囲（31〜44）内であれ
ば、エクスクルーシブオアゲート356〜358からは“010"
が出力される。乱数が４番目の音韻仮説の範囲（45〜10
0）内であれば、エクスクルーシブオアゲート356〜358
からは“001"が出力される。エンコーダ359は、これらの入力データを基にして、
それぞれの音韻仮説が格納されているアドレスを出力す
る。音声パラメータ生成部261は、レジスタ361に保持され
た２番目の音韻仮説を文字列“SHIKASHI"の音韻記号列
として読み出し、変換ルールｂ格納部271に格納された
音韻記号−パラメータ変換ルールに基づいて、音声パラ
メータを作成する。音声合成部281は、音声パラメータ
に基づく音声を出力する。（ii）カウンタによる音韻仮説の選択第４図に示す回路は、第３図に示す回路の乱数発生器
351をカウンタ451に置き換えたものであるから、カウン
タ451に着目して動作を説明する。レジスタ472に仮説選択信号が入力される毎に、レジ
スタ472のデータと所定の定数が加算器471に入力され、
それらを加算した結果を再度レジスタ472に格納する。レジスタ472からの出力データが“100"を越えるとコ
ンパレータ473から“1"が出力され、レジスタ472をリセ
ットし、最初から計数が始まる。レジスタ472から出力されるデータは乱数ではない
が、定数を選択することにより、疑似乱数として扱うこ
とができる。 IV.実施例のまとめこのように、文字列に応じて、仮説生成部211は、少
なくとも１つの音韻仮説とその出現確率を出力する。仮
説限定部251は、乱数発生器351あるいはカウンタ451を
用い、出現確率に基づいて音韻仮説の１つを選択して、
音韻記号列として出力する。音声パラメータ生成部261
では、音韻記号列を基に音声パラメータを作成し、音声
合成部281から音声を出力する。従って、自然性の高い
合成音声の生成が可能となる。 V.発明の変形態様なお、上述した本発明の実施例にあっては、コンパレ
ータの数を音韻仮説と同数としたが、コンパレータ355
からは常に“1"が出力されるので、省略して常時“1"を
エクスクルーシブオアゲート358に入力することもでき
る。また、コンパレータの数より音韻仮説の数が少ない
場合は、余分なコンパレータからは“1"を出力するよう
にすればよい。また、母音が無声化するかどうかの確率は、個人によ
って異なることがあるので、各個人の音素変形ルールを
変形ルール格納部231に格納しておいて、選択使用すれ
ば、個人性の高い合成音声を生成することも可能とな
る。更に、「I.実施例と第１図との対応関係」において、
第１図と本発明との対応関係を説明しておいたが、これ
に限られることはなく、各種の変形態様があることは当
業者であれば用意に推考できるであろう。〔発明の効果〕上述したように、本発明によれば、文字列に対応し
て、仮説生成手段で少なくとも１つの音韻仮説とその出
現確率を出力し、仮説限定手段でその中から１つを選択
して音韻記号列を出力して、自然性の高い合成音声を得
ることができ、実用的には極めて有用である。

【図面の簡単な説明】第１図は本発明の文−音声変換装置の原理ブロック図、第２図は本発明の一実施例による文−音声変換装置を適
用した全体構成図、第３図は実施例の仮説限定部の回路構成図、第４図は実施例の仮説限定部の別回路構成図、第５図は実施例における音韻仮説説明図、第６図は従来例の構成図である。図において、 111は仮説生成手段、 131は音素変形ルール格納手段、 151は仮説限定手段、 211は仮説生成部、 231は変形ルール格納部、 251は仮説限定部、 261は音声パラメータ生成部、 271は変換ルールｂ格納部、 281は音声合成部、 351は乱数発生器、 352,353,354,355,473はコンパレータ、 356,357,358はエクスクルーシブオアゲート、 359はエンコーダ、 360は仮説テーブル、 361,472はレジスタ、 362,363,364,471は加算器、 451はカウンタ、 711は音韻記号生成部、 731は変換ルールａ格納部である。

───────────────────────────────────────────────────── フロントページの続き (56)参考文献特開昭57−158900（ＪＰ，Ａ) 特開昭58−78199（ＪＰ，Ａ) 特開昭61−77897（ＪＰ，Ａ) 特開昭63−73298（ＪＰ，Ａ) 特開昭63−210995（ＪＰ，Ａ) 特開昭63−210996（ＪＰ，Ａ)

Claims

(57)【特許請求の範囲】１．入力された文章に応答して音声を出力する文−音声
変換装置において、文字に対応する音素変形ルールを格納する音素変形ルー
ル格納手段（131）と、文字列が導入され、前記音素変形ルールに基づいて、該
文字列に対応した少なくとも１つの音韻仮説と出現確率
を出力する仮説生成手段（111）と、仮説生成手段（111）から出力された出現確率に基づい
て、前記音韻仮説の中の１つを選択して音韻記号列を出
力する仮説限定手段（151）と、を備えるように構成したことを特徴とする文−音声変換
装置。２．前記音韻記号は、合成の最小単位を表す記号である
ことを特徴とする特許請求の範囲第１項記載の文−音声
変換装置。３．前記音素変形ルールは、各文字に対応した音韻記号
とその出現確率であることを特徴とする特許請求の範囲
第１項記載の文−音声変換装置。