JPH09230892A - テキスト・音声変換装置 - Google Patents

テキスト・音声変換装置

Info

Publication number
JPH09230892A
JPH09230892A JP8038062A JP3806296A JPH09230892A JP H09230892 A JPH09230892 A JP H09230892A JP 8038062 A JP8038062 A JP 8038062A JP 3806296 A JP3806296 A JP 3806296A JP H09230892 A JPH09230892 A JP H09230892A
Authority
JP
Japan
Prior art keywords
text
circuit
synthesis
waveform
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8038062A
Other languages
English (en)
Inventor
Mitsuji Matsushita
満次 松下
Seiichi Wada
誓一 和田
Yasuhiro Chiyou
康宏 頂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP8038062A priority Critical patent/JPH09230892A/ja
Publication of JPH09230892A publication Critical patent/JPH09230892A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 複数入力テキストに対するテキスト・音声変
換による複数の音響出力手段からの音響出力を簡単な構
成で、会話調の文章、対話形式の文章などの音響出力に
おける臨場感を向上させる。 【解決手段】 1番目の文章1が入力されると、テキス
ト解析回路104で、日本語解析が行われた後、中間言
語が生成回路106へ与えられる。制御回路103で
は、1番目の文章内に、2番目の文章の合成開始タイミ
ングがあることをDSP0回路114に指令する。これ
によってDSP0回路114では、波形バッファ回路1
09に波形データをバッファリングするが、合成を開始
しないで2番目の文章2の波形生成が開始されるまで待
機する。1番目の文章1の日本語解析が終わった後、テ
キスト解析回路104は、直ちに、2番目の文章2の日
本語解析を実施する。2番目の文章の日本語解析が終了
すると、パラメータ生成回路115へ中間言語を与え
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、テキスト・音声変
換装置に関し、複数入力テキストに対してテキスト・音
声変換して音響出力を行うことに適用し得るものであ
る。
【0002】
【従来の技術】従来、この種のテキスト・音声変換合成
は、ワードプロセッサなどで作成された漢字仮名混じり
文章(テキスト)を入力すると日本語解析処理を行って
入力文章から読み、そして、アクセントを抽出し、これ
に日本語の音韻規則、韻律規則から音韻の長さや、ポー
ズや、イントネーションなどを付加して音声合成出力す
るものであった。
【0003】この種の技術としては、文献1:沖電気研
究開発1991年10月第152号、ページ85〜9
0、「テキスト・音声変換技術の開発」に提案されてい
る。
【0004】図2は、従来のテキスト・音声変換合成の
概略処理フローである。この図2において、テキスト・
音声変換合成においては、第1の処理ステップとしてテ
キスト解析部があり、第2の処理ステップとしてパラメ
ータ生成部があり、第3の処理ステップとして音声合成
部がある。
【0005】上記第1の処理ステップのテキスト解析部
では、漢字仮名混じり文に対して、日本語辞書を用いて
形態素解析、アクセント設定、声立て設定やポーズ設定
などを行って、中間言語を生成するものである。更に、
第2の処理ステップのパラメータ生成部では、第1の処
理ステップで得た中間言語に対して、素片データを用い
て素片データ取り出し、音韻継続時間設定、ピッチパタ
ーン設定や振幅パターン設定などを行い、合成パラメー
タを生成するものである。更にまた、第3の処理ステッ
プの音声合成部では、上記第2の処理ステップで得た合
成パラメータに対して、波形生成を行って、合成音声を
生成出力するものである。このような構成で従来は、日
本語文章を音声に変換して出力していた。
【0006】
【発明が解決しようとする課題】しかしながら、従来の
テキスト・音声変換合成では、入力された文章を読点、
句点や改行などの単位で区切りながら日本語の解析を実
施し、入力された文章をシリアルに変換合成するもので
あり、複数の文章を同時に合成することが困難であっ
た。
【0007】従って、会話調の文章、対話形式の文章を
臨場感を持って再現させるために、複数のスピーカから
再生したい場合には、 (1)1つのテキスト・音声変換合成器で複数回に分け
て、音声合成した音を録音編集する。 (2)複数のテキスト・音声変換合成器を用いて、それ
ぞれに話者(文章)を割り当てて音声合成する。 これらの2つの方法を用いなければならなかった。
【0008】上記(1)の方法は、テキスト・音声変換
合成のリアルタイム性を著しく劣化させるため、従来の
ADPCM(適応差分PCM:Adaptive Di
ffrential PCM)を用いた方式と何等変わ
りなく操作性が悪いという問題がある。
【0009】また、上述の(2)の方法は、テキスト・
音声変換合成器が複数台必要であり、不経済である。更
に、複数のテキスト・音声変換合成器にテキストをタイ
ミング良く与える機能を持った上位装置が必要であり、
システムが大きくなるという問題がある。
【0010】これらのことから、複数入力テキストに対
するテキスト・音声変換による複数の音響出力手段から
の音響出力を簡単な構成で、会話調の文章、対話形式の
文章などの音響出力における臨場感を向上させることが
できるテキスト・音声変換装置の実現が要請されてい
る。
【0011】
【課題を解決するための手段】そこで、請求項1記載の
発明は、(1)複数の入力テキストをテキスト・音声変
換合成して、それぞれ複数の『音響出力手段』のいずれ
かから音響出力するテキスト・音声変換装置であって、
(2)上記各入力テキストには、それぞれ予め当該入力
テキストをいずれの音響出力手段から音響出力させるか
を表す「音響出力情報」と、入力テキスト間の音響合成
開始のタイミング調整を図る「合成開始タイミング情
報」とが付加されていて、(3)上記入力テキストに付
加されている音響出力情報と合成開始タイミング情報と
を読み取ると共に、上記入力テキストを解析して中間言
語を生成する『テキスト解析手段』を備え、(4)上記
中間言語から音声合成に必要なパラメータ生成と、この
パラメータによって音声波形の合成とを行う『パラメー
タ生成・波形合成手段』を上記各音響出力手段に対応し
て複数備え、(5)『上記テキスト解析手段』は、「上
記音響出力情報」と「合成開始タイミング情報」とを読
み取ることによって、上記入力テキスト間の上記パラメ
ータ生成と波形合成との合成開始タイミングの調整を図
りながら、合成開始タイミングの早い入力テキストに対
する中間言語から順番に「上記音響出力情報」に従って
対応する上記パラメータ生成・波形合成手段及び音響出
力手段に対して音響変換させて出力させるものである。
【0012】このような構成を採ることで、入力テキス
トに付加されている音響出力情報を読み取っていずれか
の音響出力手段から出力することができ、しかも、第1
の入力テキストの中に第2の入力テキストをいずれの時
点から合成するかを表す合成開始タイミング情報が付加
されているので、第1の入力テキストに対する音声合成
を行って、いずれかの音響出力手段で出力途中に第2の
入力テキストを他のパラメータ生成・波形合成手段で音
声合成して、対応する音響出力手段から出力させること
ができるのである。
【0013】同様に第2の入力テキストに対する音響出
力を行っている途中においても、第3の入力テキストを
第2の入力テキストに含まれている合成開始タイミング
情報に従って、必要な時点に合成開始させて音響出力さ
せることができるのである。
【0014】更に、パラメータ生成・波形合成手段を上
記各音響出力手段に対応して複数備えているので、テキ
スト入力が開始されてから、音響出力されるまでの時間
を短くすることができるのである。
【0015】また、請求項2の発明は、(1)複数の入
力テキストをテキスト・音声変換合成して、それぞれ複
数の『音響出力手段』のいずれかから音響出力するテキ
スト・音声変換装置であって、(2)上記各入力テキス
トにはそれぞれ予め当該入力テキストをいずれの『音響
出力手段』から音響出力させるかを表す「音響出力情
報」と、入力テキスト間の音響合成のタイミング調整を
図る「合成開始タイミング情報」とが付加されていて、
(3)上記入力テキストを解析して中間言語を生成する
『テキスト解析手段』と、(4)この中間言語から上記
音響出力情報と合成開始タイミング情報とを読み取り、
入力テキスト間の上記パラメータ生成と波形合成との合
成開始タイミングの調整を図りながら、合成開始タイミ
ングの早い入力テキストに対する中間言語から順番に音
声合成に必要なパラメータ生成と、このパラメータによ
って音声波形の合成とを行い、「上記音響出力情報」に
従って対応する『上記音響出力手段』に音声波形を与え
る『パラメータ生成・波形合成手段』とを備えたもので
ある。
【0016】このような構成を採ることで、『パラメー
タ生成・波形合成手段』で、入力テキスト間のパラメー
タ生成と波形合成との合成開始タイミングの調整を図り
ながら、合成開始タイミングの早い入力テキストに対す
る中間言語から順番に音声合成に必要なパラメータ生成
と、このパラメータによって音声波形の合成とを行っ
て、音響出力情報で指定される音響出力手段に与えてい
るので、一つのパラメータ生成・波形合成手段で、複数
の音響出力手段を出力制御し、音響出力することができ
るので、構成が簡単となる。
【0017】従って、複数の入力テキストが連続的に与
えられても各入力テキストに付加されている「合成開始
タイミング情報」で合成開始を行い、しかも「音響出力
情報」によって指定される『音響出力手段』から同じよ
うな時期に複数音響をオーバラップさせながら出力させ
ることができるのである。
【0018】
【発明の実施の形態】次に本発明の好適な実施の形態を
図面を用いて説明する。本発明の実施の形態のテキスト
・音声変換合成装置においては、(1)入力された文章
をどのスピーカから出力するか否かを指定する手段と、
(2)入力された文章の合成開始タイミングを指定する
手段と、(3)複数の音声合成出力手段(D/Aコンバ
ータ)と、(4)上記(1)〜(3)を制御する手段と
を備えるように構成する。
【0019】『第1の実施の形態』:図1は、第1の実
施の形態のテキスト・音声変換合成装置の機能構成図で
ある。この図1において、テキスト・音声変換合成装置
は、入力インタフェース回路101と、テキストバッフ
ァ回路102と、制御回路103と、テキスト解析回路
104と、日本語辞書回路105と、パラメータ生成回
路106、115、124と、波形合成回路107、1
16、125と、音声素片辞書回路108、117、1
26と、波形バッファ回路109、118、127と、
D(デジタル)/A(アナログ)変換回路110、11
9、128と、フィルタ回路111、120、129
と、アンプ回路112、121、130と、スピーカ1
13、122、131とから構成されている。
【0020】尚、パラメータ生成(0)回路106と波
形合成(0)回路107と音声素片辞書(0)回路10
8とからDSP0(デジタルシグナルプロセッサ)回路
114を構成している。同じように、パラメータ生成
(1)回路115と、波形合成(1)回路116と、音
声素片辞書(1)回路117とからDSP1回路123
を構成している。更に、パラメータ生成(n)回路12
4と、波形合成(n)回路125と、音声素片辞書
(n)回路126とからDSPn回路132を構成して
いる。
【0021】入力インタフェース回路101は、入力テ
キストを制御回路103からの制御によって調整してテ
キストバッファ回路102に与える。
【0022】テキストバッファ回路102は、入力テキ
ストを制御回路103からの制御によってテキストバッ
ファ回路内を検索して、コマンドとテキストとを分離す
る。また、コマンドを解析して動作制御を行う。テキス
トは、読点、句点、及び改行コードの指定単位で区切ら
れた後、テキスト解析回路104に与える。
【0023】制御回路103は、入力インタフェース回
路101、テキストバッファ回路102、日本語辞書回
路105、テキスト解析回路104、DSP0回路11
4、DSP1回路123、DSPn回路132などを制
御するものである。
【0024】テキスト解析回路104は、日本語辞書回
路105からの日本語辞書データを用いて形態素解析を
行い、漢字仮名混じり文から中間言語と呼ばれるアクセ
ントとイントネーションが付加された読みの表記列に変
換する。日本語辞書回路105は、制御回路103から
の制御によって、日本語辞書データをテキストバッファ
回路104に与える。
【0025】DSP0回路114は、中間言語から音韻
継続長などのパラメータを生成し、この生成パラメータ
から、音声素片辞書回路108からの音声素片辞書デー
タを用いて音声波形を合成する。パラメータ生成(0)
回路106は、音声素片辞書データを用いて中間言語か
ら音韻継続長などのパラメータを生成して波形合成
(0)回路107に与える。波形合成(0)回路107
は、音声素片辞書データを用いて音声波形を合成し、波
形バッファ(0)回路109に与えるものである。
【0026】音声素片辞書(0)回路108は、音声素
片辞書データを予め格納していて、パラメータ生成
(0)回路106と波形合成(0)回路107とに与え
るものである。波形バッファ(0)回路109は、波形
合成(0)回路107からの音声波形を一時的に格納す
るメモリ回路であり、必要な時期にD/A変換(0)回
路110にデジタル音声波形信号を出力する。
【0027】D/Aコンバータ(0)回路110は、波
形バッファ(0)回路109からのデジタル音声波形信
号をアナログの音声信号に変換してフィルタ(0)回路
111に与える。フィルタ(0)回路111は、アナロ
グの音声信号から不要な信号を除去してアンプ(0)回
路112に与える。アンプ(0)回路112は、アナロ
グの音声信号をスピーカ(0)113を駆動し得るレベ
ルに調整してスピーカ(0)113に与える。スピーカ
(0)回路113は、入力テキストに対応した合成され
た音声信号を音響出力するのである。上述の(0)系統
以外の(1)系統、(n)系統の各回路も上述と同じ機
能である。
【0028】(一文のテキストが入力される場合の動
作): 先ず、データの流れを説明する。例として、
一文のテキストが入力されて、スピーカ113から音声
を出力する場合のコマンド、テキスト送出について説明
する。この場合に、コマンドの例を図3に示す。この図
3において、n<10の整数とする。そして、コマンド
表記で、”ESC”+”An”(16進表記で1B、4
1、3n)は、番号nのスピーカ131から合成するこ
とを表すものとする。更に、コマンド表記で”ESC”
+”Sn”(16進表記で1B、53、3n)は、番号
nのスピーカ131から合成する文章の音声合成開始タ
イミングを示すものとする。
【0029】スピーカ113から音声を出力することを
指定するコマンドとしてテキストの先頭に”ESC”
+”A0”を付加する。入力テキストの例を図4に示
す。この図4において、入力テキストの例をJIS表記
で表すと、”ESC”A0山田さん。16進数表記で
は、1B、41、30、3B、33、45、44、3
4、35、24、73、21、23である。
【0030】コマンドを含む入力テキストは、入力イン
タフェース回路101に与えられると、制御回路103
からの制御によって、調整されてテキストバッファ回路
102に与えられる。上記入力テキストは、テキストバ
ッファ回路102で制御回路103からの制御によって
テキストバッファ回路内を検索して、コマンドとテキス
トとを分離する。また、コマンドを解析して動作制御を
行う。テキストは、読点、句点、及び改行コードの指定
単位で区切られた後、テキスト解析回路104に与えら
れる。
【0031】テキスト解析回路104では、日本語辞書
回路105からの日本語辞書データを用いて形態素解析
が行われて、漢字仮名混じり文から中間言語と呼ばれる
アクセントとイントネーションが付加された読みの表記
列に変換される。図5は、入力テキストと中間言語の例
を示す図である。この図5において、表記として、任意
の文章を合成します。に対して、中間言語は、『P1
ニ]ンイノ,ブ}ンショーヲ,P3ゴ}ーセーシマスP
0。』、となる。
【0032】このような中間言語は、”ESC”+”A
0”コマンドによってパラメータ生成回路106に与え
られる。パラメータ生成回路106では、音韻継続長な
どのパラメータが生成される。この生成パラメータは、
波形合成回路107に与えられる。この波形合成回路1
07では、生成パラメータから、音声素片辞書回路10
8からの音声素片辞書データを用いて音声波形が合成さ
れて、波形バッファ回路109に与えられる。
【0033】音声波形は、波形バッファ回路109に一
時格納されると、D/Aコンバータ110に与えられ
る。ここで、デジタル信号からアナログ信号に変換され
てフィルタ回路111に与えられる。フィルタ回路11
1では、音声波形に残されている歪みなどがフィルタで
除去されて、アンプ回路112に与えられる。アンプ回
路112では、音声信号がスピーカ113を駆動し得る
ように所定のレベルに増幅されてスピーカ113に与え
られるのである。
【0034】(複数文のテキストが入力される場合の動
作): 次に、複数のテキストが複数のスピーカに音
声出力される場合について説明する。そこで、入力され
るテキスト及びコマンドを図6に示している。この図6
において、文章1は、”ESC””A0”任意の文章
を”ESC””S1”合成します。である。文章2
は、”ESC””A1”それは便利ですね。である。
【0035】1番目の文章1は、先頭に”ESC”+”
A0”がついているので、スピーカ(0)113への合
成出力である。2番目の文章2は、先頭に”ESC”
+”A1”がついているので、スピーカ(1)122へ
の合成出力である。1番目の文章1の途中にある”ES
C”+”S1”は、スピーカ(1)122へ合成出力す
る文章の合成開始タイミングを示している。このタイミ
ングを図7に示している。この図7において、スピーカ
(0)113からは、時刻0の後に、『ニンイノブンシ
ョーヲゴーセーシマス。』を出力させる。スピーカ
(1)122からは、時刻ts経過直後に『ソレハベン
リデスネ。』を出力させるのである。
【0036】具体的に、図8の動作タイミング図を用い
て動作を説明する。先ず、上述の第1番目の文章1が入
力されると、テキスト解析回路104で、日本語解析が
行われた後(ステップP1)、中間言語がパラメータ生
成回路106へ与えられる。制御回路103では、1番
目の文章内に、2番目の文章の合成開始タイミングがあ
ることをDSP0回路114に指令する(ステップP
3)。これによってDSP0回路114では、波形バッ
ファ回路109に波形データをバッファリングするが、
合成を開始しないで2番目の文章2の波形生成が開始さ
れるまで待機する(ステップP4〜P6)。
【0037】1番目の文章1の日本語解析が終わった後
(ステップP1)、テキスト解析回路104は、直ち
に、2番目の文章2の日本語解析を実施する(ステップ
P2)。2番目の文章の日本語解析が終了すると、パラ
メータ生成回路115へ中間言語を与える。DSP1回
路123ではパラメータ生成回路115及び波形合成回
路116とで波形合成が行われる(ステップP7、P
8)。このDSP1回路123で波形合成が開始される
と、制御回路103に2番目の文章の合成開始が準備で
きたことを指令する(ステップP9)。
【0038】尚、DSP0〜n回路114、123、1
32は、中間言語からリアルタイムで音声波形を合成で
きる能力があるもので、その回路構成については、例え
ば、上述の文献1などにおいても提案されている。
【0039】制御回路103では、DSP0回路114
から波形バッファ回路109及びD/Aコンバータ回路
110に波形データを与えることを開始して良いことを
指令する(ステップP10、P11)。これによって、
スピーカ113からは、音声として、『ニンイノブンシ
ョーヲゴーセーシマス』が出力されるのである(ステッ
プP12)。
【0040】DSP0回路114では、文章内の”S
1”コマンドが存在していた部分の合成を開始すると制
御回路103に2番目の文章2の開始タイミングを指令
する(ステップP13)。制御回路103は、DSP1
回路123に対して2番目の文章2の合成を開始するよ
うに指令する(ステップP14)。これによって、波形
バッファ回路118からD/Aコンバータ回路119に
データが転送され(ステップP15)、スピーカ122
から音声として『ソレハベンリデスネ』が出力されるの
である(ステップP16)。
【0041】(本発明の第1の実施の形態の効果):
以上の本発明の第1の実施の形態のテキスト・音声変
換合成装置によれば、合成する文章の音声出力を指定す
るアドレス指定コマンドを設けたことと同時に音声合成
出力される文章の開始タイミングを指定するスタートコ
マンドを設けることによって、複数の文章が複数のスピ
ーカから同時に音声出力可能となり、会話文章、対話文
章の合成が容易になると共に臨場感のある音声が得られ
る。
【0042】従って、複数入力テキストに対するテキス
ト・音声変換による複数の音響出力手段からの音響出力
を簡単な構成で、会話調の文章、対話形式の文章などの
音響出力における臨場感を向上させることができる。ま
た、DSP(0)回路114、DSP(1)回路12
3、DSP(n)回路132を各音響出力手段に対応し
て複数備えているので、テキスト入力が開始されてか
ら、音響出力されるまでの時間を短くすることができ
る。
【0043】『第2の実施の形態』:上述の第1の実施
の形態においては、複数文章を入力したときに、合成出
力されるまでの時間的遅れを最小限にするために、パラ
メータ生成回路、波形生成回路などをスピーカの数だけ
設けたものである。一方、本第2の実施の形態において
は、文章入力から音声出力までの時間遅れが許される場
合の構成例である。
【0044】図9は、第2の実施の形態のテキスト・音
声変換合成装置の機能構成図である。この図9におい
て、テキスト・音声変換合成装置は、入力インタフェー
ス回路101と、テキストバッファ回路102と、制御
回路103Aと、テキスト解析回路104と、日本語辞
書回路105と、パラメータ生成回路106と、波形合
成回路107と、音声素片辞書回路108と、波形バッ
ファ回路109A、118A、127Aと、D/A変換
回路110A、119A、128Aと、フィルタ回路1
11、120、129と、アンプ回路112、121、
130と、スピーカ113、122、131とから構成
されている。
【0045】更に、パラメータ生成回路106と、波形
合成回路107と、音声素片辞書回路108とからDS
P回路114Aを形成している。しかも、本第2の実施
の形態において特徴的なことは、一つのDSP回路11
4Aでn系統のスピーカ113、122、131への音
声出力系統を制御していることである。
【0046】第1の音声出力系統は、波形バッファ
(0)回路109Aと、D/Aコンバータ(0)回路1
10Aと、フィルタ(0)回路111と、アンプ(0)
回路112と、スピーカ(0)回路113とから構成さ
れている。
【0047】第2の音声出力系統は、波形バッファ
(1)回路118Aと、D/Aコンバータ(1)回路1
19Aと、フィルタ(1)回路120と、アンプ(1)
回路121と、スピーカ(1)回路122とから構成さ
れている。
【0048】第nの音声出力系統は、波形バッファ
(n)回路127Aと、D/Aコンバータ(n)回路1
28Aと、フィルタ(n)回路129と、アンプ(n)
回路130と、スピーカ(n)回路131とから構成さ
れている。
【0049】(動作): 次に図9のテキスト・音声
変換合成装置の動作を説明する。この図9において、テ
キスト・音声変換合成装置では、先ず、入力された文章
が日本語解析されて、中間言語が得られ、パラメータ生
成回路106に与えられ、波形合成回路107で音声波
形が合成されるまでは、上述の第1の実施の形態と同様
である。本第2の実施の形態においては、特に波形合成
以降の処理が異なるのである。そこで、入力されるテキ
スト文章は上述の図6の文章1、2と同じ文章が入力さ
れるものとする。
【0050】1番目の文章1は、波形合成回路107で
波形合成されると、波形バッファ(0)回路109Aに
転送される。1番目の文章1には、2番目の文章2の合
成開始コマンドが含まれているため、D/Aコンバータ
(0)回路110Aへの転送が保留される。
【0051】2番目の文章2が波形合成回路107で波
形合成されると、波形データを波形バッファ(1)回路
118Aに転送する。DSP回路114Aは、2番目の
文章2の波形合成回路107によって波形データの合成
が開始され、波形バッファ(1)回路118Aに転送が
開始されたことを通知し、D/Aコンバータ(0)回路
110Aに対してスタート指示を与える。これによっ
て、1番目の文章1がスピーカ(0)113から音声出
力され、2番目の文章2がスピーカ(1)122から1
番目の文章内で指定されたタイミングで音声出力される
のである。
【0052】『DSP回路114Aが、2番目の文章2
の合成開始タイミングを得る方法』を以下に説明する。
先ず、波形合成回路107が波形バッファ(0)回路1
09Aに波形データを転送する際、合成開始ポインタテ
ーブルに、2番目の文章2の合成開始タイミングにおけ
るアドレスを設定するのである。
【0053】n=2の場合のポインタテーブルの例を図
10に示している。この図10において、スピーカ
(0)113から合成される1番目の文章内に、スピー
カ(1)122から音声出力される2番目の文章合成開
始タイミングがあり、そのタイミングは、波形バッファ
(0)回路109A内のアドレス1255の波形データ
をD/Aコンバータ(0)回路110Aに転送したと
き、2番目の文章2の音声出力が開始されることを意味
するもである。
【0054】2番目の文章内に3番目の文章の合成開始
タイミングがあり、そのタイミングは、波形バッファ
(1)回路118A内のアドレス2122の波形データ
をD/Aコンバータ(1)回路119Aに転送したとき
であることを示しているのである。このような構成で波
形バッファ回路とD/A変換回路とをタイミング制御す
ることで、合成開始タイミングの調整を容易に管理し、
制御することができる。
【0055】(本発明の第2の実施の形態の効果):
以上の本発明の第2の実施の形態のテキスト・音声変
換合成装置によれば、テキスト・音声変換のリアルタイ
ム性を要求しない装置においてはパラメータ作成部、波
形合成部、音声素片辞書などを一つにすることによっ
て、回路規模を大きくしないままで、複数の文書を複数
のスピーカから同時に音声合成可能にさせることができ
るため、コストの削減の効果がある。
【0056】従って、複数入力テキストに対するテキス
ト・音声変換による複数の音響出力手段からの音響出力
を簡単な構成で、会話調の文章、対話形式の文章などの
音響出力における臨場感を向上させることができる。し
かも、上述の第1の実施の形態よりも構成を簡単にする
ことができる。
【0057】(他の実施の形態): (1)尚、上述
の実施の形態においては、入力は全て文章であるように
説明したが、波形バッファに音楽データ、擬音データ
(例えば、動物の声などのデータ)を予め転送しておけ
ば、音声出力と同時に他のスピーカからBGM(Bac
k Ground Music)或いは効果音を流すこ
とも可能である。
【0058】(2)また、入力端子100は、CPU又
はMPUからのシステムバスにライン接続されて、この
システムバスラインからCPU又はMPUの命令によっ
てテキストデータが入力される構成も採ることができ
る。
【0059】(3)更に、テキスト・音声変換合成部に
は、沖電気工業製品であるLSIである、MSM757
6を採用することもできる。これによって装置の小形化
を図ることもできる。このLSIを採用することで、上
記システムバスの他にローカルバスを使用することもで
き、このローカルバスに単語辞書や音声素片辞書などの
ROMや、ワークRAMを接続することもできるのであ
る。
【0060】(4)更にまた、上述のようなテキスト・
音声変換装置は、娯楽装置である、例えば、ゲーム機器
などにおいて、ゲースの進行と共にいろいろな複数の音
響を多重出力する上で好適であり、このような適用を行
うことでそのゲームにおける臨場感を益々向上させるこ
とができるのである。
【0061】
【発明の効果】上述したように請求項1記載の発明は、
複数の入力テキストをテキスト・音声変換合成して、そ
れぞれ複数の音響出力手段のいずれかから音響出力する
テキスト・音声変換装置であって、上記各入力テキスト
には、それぞれ予め当該入力テキストをいずれの音響出
力手段から音響出力させるかを表す音響出力情報と、入
力テキスト間の音響合成開始のタイミング調整を図る合
成開始タイミング情報とが付加されていて、入力テキス
トに付加されている音響出力情報と合成開始タイミング
情報とを読み取ると共に、上記入力テキストを解析して
中間言語を生成するテキスト解析手段を備え、中間言語
から音声合成に必要なパラメータ生成と、このパラメー
タによって音声波形の合成とを行うパラメータ生成・波
形合成手段を各音響出力手段に対応して複数備え、テキ
スト解析手段が、音響出力情報と合成開始タイミング情
報とを読み取ることによって、入力テキスト間の上記パ
ラメータ生成と波形合成との合成開始タイミングの調整
を図りながら、合成開始タイミングの早い入力テキスト
に対する中間言語から順番に音響出力情報に従って対応
するパラメータ生成・波形合成手段及び音響出力手段に
対して音響変換させて出力させるものである。
【0062】このような構成を採ったことで、複数入力
テキストに対するテキスト・音声変換による複数の音響
出力手段からの音響出力を簡単な構成で、会話調の文
章、対話形式の文章などの音響出力における臨場感を向
上させるテキスト・音声変換装置を実現することができ
る。
【0063】特に、パラメータ生成・波形合成手段を上
記各音響出力手段に対応して複数備えていることで、テ
キスト入力から音響出力までの変換出力時間を短くする
ことができる。
【0064】また、請求項2記載の発明は、複数の入力
テキストをテキスト・音声変換合成して、それぞれ複数
の音響出力手段のいずれかから音響出力するテキスト・
音声変換装置であって、上記各入力テキストにはそれぞ
れ予め当該入力テキストをいずれの音響出力手段から音
響出力させるかを表す音響出力情報と、入力テキスト間
の音響合成のタイミング調整を図る合成開始タイミング
情報とが付加されていて、上記入力テキストを解析して
中間言語を生成するテキスト解析手段と、この中間言語
から上記音響出力情報と合成開始タイミング情報とを読
み取り、入力テキスト間の上記パラメータ生成と波形合
成との合成開始タイミングの調整を図りながら、合成開
始タイミングの早い入力テキストに対する中間言語から
順番に音声合成に必要なパラメータ生成と、このパラメ
ータによって音声波形の合成とを行い、音響出力情報に
従って対応する音響出力手段に音声波形を与えるパラメ
ータ生成・波形合成手段とを備えたものである。
【0065】このような構成を採ったことで、複数入力
テキストに対するテキスト・音声変換による複数の音響
出力手段からの音響出力を更に簡単な構成で、会話調の
文章、対話形式の文章などの音響出力における臨場感を
向上させるテキスト・音声変換装置を実現することがで
きる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態のテキスト・音声変
換合成装置の機能構成図である。
【図2】従来例のテキスト・音声変換合成の説明図であ
る。
【図3】第1の実施の形態のコマンド実施例(n<10
の整数)の説明図である。
【図4】第1の実施の形態の入力テキスト例(JIS表
記)の説明図である。
【図5】第1の実施の形態の中間言語の例の説明図であ
る。
【図6】第1の実施の形態のテキスト、コマンド例の説
明図である。
【図7】第1の実施の形態の複数文章の合成開始タイミ
ングの説明図である。
【図8】第1の実施の形態のテキスト・音声変換合成装
置の動作タイミング図である。
【図9】本発明の第2の実施の形態のテキスト・音声変
換合成装置の機能構成図である。
【図10】第2の実施の形態の合成開始ポインタテーブ
ルの説明図である。
【符号の説明】
101…入力インタフェース回路、102…テキストバ
ッファ回路、103…制御回路、104…テキスト解析
回路、105…日本語辞書回路、106…パラメータ生
成(0)回路、107…波形合成(0)回路、108…
音声素片辞書(0)回路、109…波形バッファ(0)
回路、110…D/Aコンバータ(0)回路、111…
フィルタ(0)回路、112…アンプ(0)回路、11
3…スピーカ(0)回路。

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 複数の入力テキストをテキスト・音声変
    換して、それぞれ複数の音響出力手段のいずれかから音
    響出力するテキスト・音声変換装置であって、 上記各入力テキストには、それぞれ予め当該入力テキス
    トをいずれの上記音響出力手段から音響出力させるかを
    表す音響出力情報と、上記入力テキスト間の音響合成開
    始のタイミング調整を図る合成開始タイミング情報とが
    付加されていて、 上記入力テキストに付加されている音響出力情報及び合
    成開始タイミング情報を読み取ると共に、上記入力テキ
    ストを解析して中間言語を生成するテキスト解析手段を
    備え、 上記中間言語から音声合成に必要なパラメータ生成と、
    このパラメータによって音声波形の合成とを行うパラメ
    ータ生成・波形合成手段を上記各音響出力手段に対応し
    て複数備え、 上記テキスト解析手段は、上記音響出力情報と合成開始
    タイミング情報とを読み取ることによって、上記入力テ
    キスト間の上記パラメータ生成と波形合成との合成開始
    タイミングの調整を図りながら、合成開始タイミングの
    早い入力テキストに対する中間言語から順番に上記音響
    出力情報に従って対応する上記パラメータ生成・波形合
    成手段及び音響出力手段に対して音響変換させて出力さ
    せることを特徴とするテキスト・音声変換装置。
  2. 【請求項2】 複数の入力テキストをテキスト・音声変
    換して、それぞれ複数の音響出力手段のいずれかから音
    響出力するテキスト・音声変換装置であって、 上記各入力テキストにはそれぞれ予め当該入力テキスト
    をいずれの音響出力手段から音響出力させるかを表す音
    響出力情報と、上記入力テキスト間の音響合成のタイミ
    ング調整を図る合成開始タイミング情報とが付加されて
    いて、 上記入力テキストを解析して中間言語を生成するテキス
    ト解析手段と、 この中間言語から上記音響出力情報と合成開始タイミン
    グ情報とを読み取り、上記入力テキスト間の上記パラメ
    ータ生成と波形合成との合成開始タイミングの調整を図
    りながら、合成開始タイミングの早い入力テキストに対
    する中間言語から順番に音声合成に必要なパラメータ生
    成と、このパラメータによって音声波形の合成とを行
    い、上記音響出力情報に従って対応する上記音響出力手
    段に音声波形を与えるパラメータ生成・波形合成手段と
    を備えたことを特徴とするテキスト・音声変換装置。
  3. 【請求項3】 更に、上記音響出力手段は、少なくとも
    波形バッファ部とデジタル/アナログ変換部とから構成
    し、 上記パラメータ生成・波形合成手段は、音響出力タイミ
    ングを調整するために波形バッファ部とデジタル/アナ
    ログ変換部とに対してタイミング制御信号を与えること
    を特徴とする請求項2記載のテキスト・音声変換装置。
  4. 【請求項4】 更に、上記パラメータ生成・波形合成手
    段は、ポインタテーブルで各音響出力手段に対する上記
    タイミング制御信号の生成を管理・制御することを特徴
    とする請求項3記載のテキスト・音声変換装置。
  5. 【請求項5】 更に、上記波形バッファ部に予め上記入
    力テキストに対応する音声波形以外の効果音としての音
    響信号を予め格納しておき、上記入力テキストに対する
    音声出力と共に上記効果音としての音響出力を行う構成
    であることを特徴とする請求項3又は4記載のテキスト
    ・音声変換装置。
JP8038062A 1996-02-26 1996-02-26 テキスト・音声変換装置 Pending JPH09230892A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8038062A JPH09230892A (ja) 1996-02-26 1996-02-26 テキスト・音声変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8038062A JPH09230892A (ja) 1996-02-26 1996-02-26 テキスト・音声変換装置

Publications (1)

Publication Number Publication Date
JPH09230892A true JPH09230892A (ja) 1997-09-05

Family

ID=12515019

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8038062A Pending JPH09230892A (ja) 1996-02-26 1996-02-26 テキスト・音声変換装置

Country Status (1)

Country Link
JP (1) JPH09230892A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000075876A (ja) * 1998-08-28 2000-03-14 Ricoh Co Ltd 文書読み上げシステム
JP2001324992A (ja) * 2000-05-15 2001-11-22 Fujitsu Ten Ltd 音声合成装置、及び音声データ記憶媒体
JP2021067878A (ja) * 2019-10-25 2021-04-30 東京瓦斯株式会社 音声再生システム、音声再生装置およびプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000075876A (ja) * 1998-08-28 2000-03-14 Ricoh Co Ltd 文書読み上げシステム
JP2001324992A (ja) * 2000-05-15 2001-11-22 Fujitsu Ten Ltd 音声合成装置、及び音声データ記憶媒体
JP2021067878A (ja) * 2019-10-25 2021-04-30 東京瓦斯株式会社 音声再生システム、音声再生装置およびプログラム

Similar Documents

Publication Publication Date Title
JP4516863B2 (ja) 音声合成装置、音声合成方法及びプログラム
US6212501B1 (en) Speech synthesis apparatus and method
JP3673471B2 (ja) テキスト音声合成装置およびプログラム記録媒体
JPS62231998A (ja) 音声合成方法および装置
JP3518898B2 (ja) 音声合成装置
JPH09230892A (ja) テキスト・音声変換装置
JP3233036B2 (ja) 歌唱音合成装置
JPH11249679A (ja) 音声合成装置
JP3081300B2 (ja) 残差駆動型音声合成装置
JP2573586B2 (ja) 規則型音声合成装置
JP3314058B2 (ja) 音声合成方法及び装置
JP2577372B2 (ja) 音声合成装置および方法
JP2002311979A (ja) 音声合成装置および音声合成方法、並びにプログラムおよび記録媒体
JP2573585B2 (ja) 音声スペクトルパタン生成装置
JP3284634B2 (ja) 規則音声合成装置
JPS63262699A (ja) 音声分析,合成装置
JP2584236B2 (ja) 規則音声合成装置
JP3870583B2 (ja) 音声合成装置および記憶媒体
JP3862300B2 (ja) 音声合成に用いる情報の処理方法および装置
JP2586040B2 (ja) 音声編集合成装置
JP2551041B2 (ja) 音声合成装置
JP2573587B2 (ja) ピッチパタン生成装置
JPH02251998A (ja) 音声合成装置
JPH11352997A (ja) 音声合成装置およびその制御方法
JP2001166787A (ja) 音声合成装置および自然言語処理方法