JP2702919B2 - 文−音声変換装置 - Google Patents

文−音声変換装置

Info

Publication number
JP2702919B2
JP2702919B2 JP62058622A JP5862287A JP2702919B2 JP 2702919 B2 JP2702919 B2 JP 2702919B2 JP 62058622 A JP62058622 A JP 62058622A JP 5862287 A JP5862287 A JP 5862287A JP 2702919 B2 JP2702919 B2 JP 2702919B2
Authority
JP
Japan
Prior art keywords
hypothesis
phoneme
input
sentence
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP62058622A
Other languages
English (en)
Other versions
JPS63223792A (ja
Inventor
達郎 松本
晋太 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP62058622A priority Critical patent/JP2702919B2/ja
Publication of JPS63223792A publication Critical patent/JPS63223792A/ja
Application granted granted Critical
Publication of JP2702919B2 publication Critical patent/JP2702919B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔目 次〕 概要 産業上の利用分野 従来の技術 発明が解決しようとする問題点 問題点を解決するための手段 作用 実施例 I.実施例と第1図との対応関係 II.実施例の構成 III.実施例の動作 (i)乱数発生器による音韻仮説の選択 (ii)カウンタによる音韻仮説の選択 IV.実施例のまとめ V.発明の変形態様 発明の効果 〔概 要〕 文−音声変換装置であって、文字列に対応して、仮説
生成手段で少なくとも1つの音韻仮説とその出現確率を
出力し、仮説限定手段でその中から1つを選択して音韻
記号列を出力することにより、自然性の高い合成音声の
生成が可能となる。 〔産業上の利用分野〕 本発明は、文−音声変換装置に関し、特に、入力され
た文字列に対応して、自然性の高い音声出力を得るため
の文−音声変換装置に関するものである。 〔従来の技術〕 一般に、文−音声変換装置は、翻訳電話,コンピュー
タの音声出力装置,盲人用読書器等に利用されている。 第6図は、一般的な文−音声変換装置の構成を示す。
図において、音韻記号生成部711には、文字列が入力さ
れ、変換ルールa格納部731に格納された文字列−音韻
記号変換ルールに基づいて、音素環境などを考慮した音
韻記号列を作成する。例えば日本語において、音素/N/
は、置かれた環境によって、音韻〔m〕,〔n〕,
〔η〕になる。音声パラメータ生成部261には、音韻記
号生成部711で作成された音韻記号列が入力され、変換
ルールb格納部271に格納された音韻記号−パラメータ
変換ルールに基づいて、音声パラメータを作成する。音
声合成部281は、音声パラメータに基づいて音声を出力
する。 〔発明が解決しようとする問題点〕 ところで、上述したように、置かれた環境によって必
ず音素変形が生じる場合、その変形した音素を条件異音
と言う。 一方、ある環境で音素変形が生じたり、生じなかった
りする場合があり、そのときの変形した音素を自由異音
と言う。例えば日本語において、無声子音に囲まれた母
音は、無声化したりしなかったりする。これは、個人的
要因,発生速度,意味等に依存するものであるが、一義
的に決められるものではない。 上述した従来方式にあっては、1つの文字列に対し
て、それに対応する音韻記号が一義的に決定されるため
に、実際の発生に現れる自由異音のようなゆらぎを得る
ことはできなかった。そのため、同じ文を音声に変換す
る場合、常に同じ音声になってしまい、自然性に欠ける
という問題点があった。 本発明は、このような点にかんがみて創作されたもの
であり、自然性の高い合成音声の生成が可能となるよう
にした文−音声変換装置を提供することを目的としてい
る。 〔問題点を解決するための手段〕 第1図は、本発明の文−音声変換装置の原理ブロック
図である。 図において、入力された文章に応答して音声を出力す
る文−音声変換装置における音素変形ルール格納手段13
1は、文字に対応する音素変形ルールを格納している。 仮説生成手段111は、文字列が導入され、音素変形ル
ールに基づいて、該文字列に対応した少なくとも1つの
音韻仮説と出現確率を出力する。 仮説限定手段151は、仮説生成手段111から出力された
出現確率に基づいて、音韻仮説の中の1つを選択して音
韻記号列を出力する。 従って、全体として、文字列に対応した音韻記号列を
出力するように構成されている。 〔作 用〕 仮説生成手段111には文字列が導入され、音素変形ル
ール格納手段131に格納されている各文字に対応する音
素変形ルールに基づいて、文字列に対応する少なくとも
1つの音韻仮説と出現確率を出力する。 仮説限定手段151は、仮説生成手段111から出力された
出現確率に基づいて、音韻仮説の中の1つを選択して音
韻記号列を出力する。 本発明にあっては、仮説生成手段111から出力される
少なくとも1つの音韻仮説の中から、それぞれの出現確
率に基づいて1つを選択して、音韻記号列を出力するこ
とにより、自然性の高い合成音声の生成が可能となる。 〔実施例〕 以下、図面に基づいて本発明の実施例について詳細に
説明する。 第2図は、本発明の一実施例における文−音声変換装
置の全体構成を示す。 I.実施例と第1図との対応関係 ここで、本発明の実施例と第1図との対応関係を示し
ておく。 仮説生成手段111は、仮説生成部211に相当する。 音素変形ルール格納手段131は、変形ルール格納部231
に相当する。 仮説限定手段151は、仮説限定部251に相当する。 以上のような対応関係があるものとして、以下本発明
の実施例について説明する。 II.実施例の構成 第2図において、仮説生成部211は、文字列が入力さ
れ、各文字に対応した音韻とその出現確率を変形ルール
格納部231から読み出して、音韻仮説及びその出現確率
を出力する。尚、1つの文字列に複数の自由異音が存在
すると、仮説生成部211で作成される音韻仮説の数は、
それらの積となる。 仮説限定部251は、仮説生成部211から出力された出現
確率に基づき、音韻仮説の中から1つを選択して、音韻
記号列を出力する。音声パラメータ生成部261には、仮
説限定部251からの音韻記号列が入力され、変換ルール
b格納部271に格納された音韻記号−パラメータ変換ル
ールに基づいて、音声パラメータを作成する。 音声合成部281は、音声パラメータに基づいて音声を
出力する。 第3図は、第2図の仮説限定部251の具体的な回路例
を示す。図において、乱数発生器351は、仮説生成部211
からの仮説選択信号が入力されると乱数を発生して、4
つのコンパレータ352〜355の各入力端1に入力する。コ
ンパレータ352〜355の各入力端2には、仮説生成部211
からの各音韻仮説の出現確率が入力される。なお、コン
パレータ353の入力端2へは、コンパレータ352に入力さ
れる1番目の音韻仮説の出現確率と2番目の音韻仮説の
出現確率とを加算器362で加算して入力する。同様に、
コンパレータ354の入力端2へは、コンパレータ353に入
力される出現確率と3番目の音韻仮説の出現確率とを加
算器363で加算して入力する。コンパレータ355の入力端
2へは、コンパレータ354に入力される出現確率と4番
目の音韻仮説の出現確率とを加算器364で加算して入力
する。 コンパレータ352〜355のそれぞれは、(入力端1から
のデータ)≦(入力端2からのデータ)のときに“1"を
出力する。 コンパレータ352の出力は、エクスクルーシブオアゲ
ート356の一方の入力端に入力される。コンパレータ353
の出力は、エクスクルーシブオアゲート356の他方の入
力端及びエクスクルーシブオアゲート357の一方の入力
端に入力される。コンパレータ354の出力は、エクスク
ルーシブオアゲート357の他方の入力端及びエクスクル
ーシブオアゲート358の一方の入力端に入力される。コ
ンパレータ355の出力は、エクスクルーシブオアゲート3
58の他方の入力端に入力される。 3つのエクスクルーシブオアゲート356〜358の出力
は、エンコーダ359に入力され、エンコーダ359では音韻
仮説を指定するためのアドレスを出力する。 仮説テーブル360は、仮説生成部211で作成された音韻
仮説を格納し、エンコーダ359で指定されたアドレスに
対応した音韻仮説を出力し、レジスタ361に保持する。 第4図は、第2図の仮説限定部251の別回路例を示
す。図に示す回路は、第3図の乱数発生器351をカウン
タ451に置き換えたものであるので、カウンタ451につい
て説明する。カウンタ451は、加算器471,レジスタ472,
コンパレータ473で構成されている。 仮説生成部211からの仮説選択信号は、レジスタ472に
入力される。レジスタ472に格納されたデータが読み出
されると、コンパレータ352〜355に入力されると共に、
コンパレータ473の一方の入力端及び加算器471の一方の
入力端に入力される。加算器471の他方の入力端には、
所定の定数が入力され、加算器471の出力はレジスタ472
に書き込まれる。コンパレータ473の他方の入力端に
は、所定の数字(例えば“100")が入力され、コンパレ
ータ473からの出力はリセット信号として、レジスタ472
に入力される。 III.実施例の動作 第5図(イ)は、変形ルール格納部231に格納された
母音“i"の音素変形ルールを示す。図において、矢印の
左側は変換対象を示しており、右側は変換結果を示して
いる。更に、スラッシュ(/)の右側は変換対象の環境
を示している。また、 は無声化したiを、〔−voc〕は無声を示す属性を、#
#は単語境界を、++は意味の切れ目の形態素境界を表
している。また、アンダーラインは変形対象の存在場所
を示している。 変形対象として“i"を考えた場合、無声子音に囲まれ
た“i"は、無声化する確率が30%であり、また、“i"の
次が単語あるいは意味の切れ目になるときは、無声化す
る確率が20%である。 第5図(ロ)は、第5図(イ)のルールに基づく、文
字列“SHIKASHI(しかし)”の音韻仮説の作成例を示
す。“SHIKASHI"には、母音“i"が2つ使用されている
ので、それぞれについて無声化する場合としない場合が
考えられ、全体としては4通りの音韻仮説が考えられ
る。また、乱数範囲内に、発生した乱数が存在するとき
に、その音韻仮説を選択する。尚、音韻仮説は発音記号
で記述した。 いま、文字列として“SHIKASHI"を考え、文字列中の
2つの母音“i"のみが無声化したりしなかったりするも
のとする。また、第2図の仮説限定部251の回路とし
て、乱数発生器351を使用した回路(第3図)とカウン
タ451を使用した回路(第4図)を分けて説明する。 以下、第2図〜第5図を参照する。 (i)乱数発生器による音韻仮説の選択 最初に、仮説生成部211に文字列“SHIKASHI"が入力さ
れる。仮説生成部211は、文字列中の最初に現れる母音
“i"が無声子音に囲まれているので、変形ルール格納部
231に格納された音素変形ルールに基にして、無声化す
る確率が30%,無声化しない確率が70%であることを読
み出す。同様に、文字列中の2番目に現れる母音“i"が
単語境界なので、無声化する確率が20%,無声化しない
確率が80%であることを読み出す。 次に、仮説生成部211は、変形ルール格納部231から読
み出した確率を基にして、文字列“SHIKASHI"の音韻仮
説とその出現確率を求めて出力する。 音韻仮説の1つとしては、2つの母音“i"が共に無声
化する場合 が考えられ、それぞれの母音“i"の無声化の確率が30%
と20%であるから、2つの母音“i"が共に無声化する確
率は6%となる。 同様に、最初の母音“i"が無声化し、2番目の母音
“i"が無声化しない場合 の確率は24%となる。最初の母音“i"が無声化しない
で、2番目の母音“i"が無声化する場合 の確率は14%となる。2つの母音“i"が共に無声化する
場合(音韻仮説〔∫ika∫i〕)の確率は56%となる。 仮説生成部211は、上述の音韻仮説とその出現確率と
共に仮説選択信号を仮説限定部251に出力する。 仮説生成部211からの音韻仮説は、仮説テーブル360に
格納される。 複数の音韻仮説の出現確率は、コンパレータ352〜355
に入力される。文字列“SHIKASHI"の場合の2つの“i"
が無声化する確率は6%なので、“6"がコンパレータ35
2及び加算器362に入力される(図中P1)。同様に、最初
の“i"のみが無声化する確率は24%なので、“24"が加
算器362に入力される(図中P2)。加算器362では、入力
された“6"と“24"とを加算し、加算結果“30"をコンパ
レータ353及び加算器363に入力する。 2番目の“i"のみが無声化する確率は14%なので、
“14"が加算器363に入力される(図中P3)。加算器363
では、入力された“14"と“30"とを加算し、加算結果
“44"をコンパレータ354及び加算器364に入力する。 2つの“i"が無声化しない確率は56%なので、“56"
が加算器364に入力される(図中P4)。加算器364では、
入力された“44"と“56"とを加算し、加算結果“100"を
コンパレータ355に入力する。 乱数発生器351には、音韻仮説とその出現確率が入力
されると共に仮説選択信号が入力され、乱数発生器351
はそれを受けて1〜100の範囲内で乱数を発生する。発
生した乱数(例えば“20")は、コンパレータ352〜355
の入力端1に入力される。 コンパレータ352は、入力端2に“6"が入力されてお
り、(入力端1からのデータ“20")>(入力端2から
のデータ“6")なので、“0"を出力する。出力データ
は、エクスクルーシブオアゲート356に入力される。 同様に、コンパレータ353は、入力端2に“30"が入力
されており、(入力端1からのデータ“20")<(入力
端2からのデータ“30")なので、“1"を出力する。出
力データは、エクスクルーシブオアゲート356及びエク
スクルーシブオアゲート357に入力される。 コンパレータ354は入力端2に“48"が入力されてお
り、(入力端1からのデータ“20")<(入力端2から
のデータ“48")なので、“1"を出力する。出力データ
は、エクスクルーシブオアゲート357及びエクスクルー
シブオアゲート358に入力される。 コンパレータ355は、入力端2に“100"が入力されて
おり、(入力端1からのデータ“20")<(入力端2か
らのデータ“100")なので、“1"を出力する。出力デー
タは、エクスクルーシブオアゲート358に入力される。 エクスクルーシブオアゲート356は、2つの入力デー
タ(“0"と“1")の排他的論理和をとって“1"を出力す
る。同様に、エクスクルーシブオアゲート357は、2つ
の入力データ(“1"と“1")の排他的論理和をとって
“0"を出力する。エクスクルーシブオアゲート358は、
2つの入力データ(“1"と“1")の排他的論理和をとっ
て“0"を出力する。 エクスクルーシブオアゲート356〜358の出力データ
“100"は、エンコーダ359に入力される。エンコーダ359
は、仮説テーブル360の2番目の音韻仮説 が格納されているアドレスを出力する。 仮説テーブル360からは、エンコーダ359でアドレスを
指定したデータが読み出されてレジスタ361に保持され
る。 なお、上述では乱数を“20"とし、2番目の音韻仮説
の範囲(7〜30)内の値を考えたが、乱数が1番目の音
韻仮説の範囲(1〜6)内であれば、エクスクルーシブ
オアゲート356〜358からは“000"が出力される。同様
に、乱数が3番目の音韻仮説の範囲(31〜44)内であれ
ば、エクスクルーシブオアゲート356〜358からは“010"
が出力される。乱数が4番目の音韻仮説の範囲(45〜10
0)内であれば、エクスクルーシブオアゲート356〜358
からは“001"が出力される。 エンコーダ359は、これらの入力データを基にして、
それぞれの音韻仮説が格納されているアドレスを出力す
る。 音声パラメータ生成部261は、レジスタ361に保持され
た2番目の音韻仮説を文字列“SHIKASHI"の音韻記号列
として読み出し、変換ルールb格納部271に格納された
音韻記号−パラメータ変換ルールに基づいて、音声パラ
メータを作成する。音声合成部281は、音声パラメータ
に基づく音声を出力する。 (ii)カウンタによる音韻仮説の選択 第4図に示す回路は、第3図に示す回路の乱数発生器
351をカウンタ451に置き換えたものであるから、カウン
タ451に着目して動作を説明する。 レジスタ472に仮説選択信号が入力される毎に、レジ
スタ472のデータと所定の定数が加算器471に入力され、
それらを加算した結果を再度レジスタ472に格納する。 レジスタ472からの出力データが“100"を越えるとコ
ンパレータ473から“1"が出力され、レジスタ472をリセ
ットし、最初から計数が始まる。 レジスタ472から出力されるデータは乱数ではない
が、定数を選択することにより、疑似乱数として扱うこ
とができる。 IV.実施例のまとめ このように、文字列に応じて、仮説生成部211は、少
なくとも1つの音韻仮説とその出現確率を出力する。仮
説限定部251は、乱数発生器351あるいはカウンタ451を
用い、出現確率に基づいて音韻仮説の1つを選択して、
音韻記号列として出力する。音声パラメータ生成部261
では、音韻記号列を基に音声パラメータを作成し、音声
合成部281から音声を出力する。従って、自然性の高い
合成音声の生成が可能となる。 V.発明の変形態様 なお、上述した本発明の実施例にあっては、コンパレ
ータの数を音韻仮説と同数としたが、コンパレータ355
からは常に“1"が出力されるので、省略して常時“1"を
エクスクルーシブオアゲート358に入力することもでき
る。また、コンパレータの数より音韻仮説の数が少ない
場合は、余分なコンパレータからは“1"を出力するよう
にすればよい。 また、母音が無声化するかどうかの確率は、個人によ
って異なることがあるので、各個人の音素変形ルールを
変形ルール格納部231に格納しておいて、選択使用すれ
ば、個人性の高い合成音声を生成することも可能とな
る。 更に、「I.実施例と第1図との対応関係」において、
第1図と本発明との対応関係を説明しておいたが、これ
に限られることはなく、各種の変形態様があることは当
業者であれば用意に推考できるであろう。 〔発明の効果〕 上述したように、本発明によれば、文字列に対応し
て、仮説生成手段で少なくとも1つの音韻仮説とその出
現確率を出力し、仮説限定手段でその中から1つを選択
して音韻記号列を出力して、自然性の高い合成音声を得
ることができ、実用的には極めて有用である。
【図面の簡単な説明】 第1図は本発明の文−音声変換装置の原理ブロック図、 第2図は本発明の一実施例による文−音声変換装置を適
用した全体構成図、 第3図は実施例の仮説限定部の回路構成図、 第4図は実施例の仮説限定部の別回路構成図、 第5図は実施例における音韻仮説説明図、 第6図は従来例の構成図である。 図において、 111は仮説生成手段、 131は音素変形ルール格納手段、 151は仮説限定手段、 211は仮説生成部、 231は変形ルール格納部、 251は仮説限定部、 261は音声パラメータ生成部、 271は変換ルールb格納部、 281は音声合成部、 351は乱数発生器、 352,353,354,355,473はコンパレータ、 356,357,358はエクスクルーシブオアゲート、 359はエンコーダ、 360は仮説テーブル、 361,472はレジスタ、 362,363,364,471は加算器、 451はカウンタ、 711は音韻記号生成部、 731は変換ルールa格納部である。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭57−158900(JP,A) 特開 昭58−78199(JP,A) 特開 昭61−77897(JP,A) 特開 昭63−73298(JP,A) 特開 昭63−210995(JP,A) 特開 昭63−210996(JP,A)

Claims (1)

  1. (57)【特許請求の範囲】 1.入力された文章に応答して音声を出力する文−音声
    変換装置において、 文字に対応する音素変形ルールを格納する音素変形ルー
    ル格納手段(131)と、 文字列が導入され、前記音素変形ルールに基づいて、該
    文字列に対応した少なくとも1つの音韻仮説と出現確率
    を出力する仮説生成手段(111)と、 仮説生成手段(111)から出力された出現確率に基づい
    て、前記音韻仮説の中の1つを選択して音韻記号列を出
    力する仮説限定手段(151)と、 を備えるように構成したことを特徴とする文−音声変換
    装置。 2.前記音韻記号は、合成の最小単位を表す記号である
    ことを特徴とする特許請求の範囲第1項記載の文−音声
    変換装置。 3.前記音素変形ルールは、各文字に対応した音韻記号
    とその出現確率であることを特徴とする特許請求の範囲
    第1項記載の文−音声変換装置。
JP62058622A 1987-03-13 1987-03-13 文−音声変換装置 Expired - Fee Related JP2702919B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62058622A JP2702919B2 (ja) 1987-03-13 1987-03-13 文−音声変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62058622A JP2702919B2 (ja) 1987-03-13 1987-03-13 文−音声変換装置

Publications (2)

Publication Number Publication Date
JPS63223792A JPS63223792A (ja) 1988-09-19
JP2702919B2 true JP2702919B2 (ja) 1998-01-26

Family

ID=13089668

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62058622A Expired - Fee Related JP2702919B2 (ja) 1987-03-13 1987-03-13 文−音声変換装置

Country Status (1)

Country Link
JP (1) JP2702919B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0372734B1 (en) * 1988-11-23 1994-03-09 Digital Equipment Corporation Name pronunciation by synthesizer

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55133099A (en) * 1979-04-02 1980-10-16 Fujitsu Ltd Voice synthesizer
JPS60166600A (ja) * 1984-02-10 1985-08-29 富士通株式会社 放射冷却器
JPS63210995A (ja) * 1987-02-27 1988-09-01 日本電気株式会社 音素バランステキスト生成装置
JPS63210996A (ja) * 1987-02-27 1988-09-01 日本電気株式会社 アクセントパタンバランステキスト生成装置

Also Published As

Publication number Publication date
JPS63223792A (ja) 1988-09-19

Similar Documents

Publication Publication Date Title
CN110797006B (zh) 端到端的语音合成方法、装置及存储介质
EP1071074B1 (en) Speech synthesis employing prosody templates
EP1668628A1 (en) Method for synthesizing speech
JP5198046B2 (ja) 音声処理装置及びそのプログラム
Silva et al. A rule-based grapheme-phone converter and stress determination for Brazilian Portuguese natural language processing
JP2702919B2 (ja) 文−音声変換装置
Naser et al. Implementation of subachan: Bengali text to speech synthesis software
JPH08248993A (ja) 音韻時間長制御方法
JP3058439B2 (ja) 規則音声合成装置
JPS6014360B2 (ja) 音声応答装置
Hendessi et al. A speech synthesizer for Persian text using a neural network with a smooth ergodic HMM
JPH10333699A (ja) 音声認識および音声合成装置
JPH11344998A (ja) 読み韻律情報設定方法及び装置及び読み韻律情報設定プログラムを格納した記憶媒体
JP2002123281A (ja) 音声合成装置
Dessai et al. Development of Konkani TTS system using concatenative synthesis
JP3171775B2 (ja) 音声合成装置
JP2003005776A (ja) 音声合成装置
Shanavas Malayalam Text-to-Speech Conversion: An Assistive Tool for Visually Impaired People.
JP3318290B2 (ja) 音声合成方法および装置
Bharthi et al. Unit selection based speech synthesis for converting short text message into voice message in mobile phones
JPS63110498A (ja) 規則型音声合成装置
JPH06176023A (ja) 音声合成システム
JPH037999A (ja) 音声出力装置
JP2573585B2 (ja) 音声スペクトルパタン生成装置
JPS58168096A (ja) 複数言語音声合成装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees