JP2002221980A

JP2002221980A - テキスト音声変換装置

Info

Publication number: JP2002221980A
Application number: JP2001017058A
Authority: JP
Inventors: Hiroki Kamanaka; 博樹釜中
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 2001-01-25
Filing date: 2001-01-25
Publication date: 2002-08-09
Also published as: US7260533B2; US20030074196A1

Abstract

(57)【要約】【課題】聞き飽きたり疲れたりしない合成音声を出力
する。【解決手段】テキスト中の音関連用語に対応する実録
音の音声波形を読み出してテキストの合成音声波形に結
合するか重畳させて出力する日本語テキスト変換装置を
提供する。この装置は、外部から入力されたテキストを
音声波形に変換する変換処理部を具える。この装置は、
さらに、テキスト解析部と結合されたフレ−ズ辞書と、
音声規則合成部と結合されている波形辞書を具える。フ
レ−ズ辞書には、実録音の再生音として表現されるべ
き音関連用語が予め登録されている。波形辞書には、実
録音で得た、該音関連用語に対応する波形デ−タが予め
登録されている。変換処理部は、テキスト中の用語とフ
レ−ズ辞書に登録されている音関連用語との照合が一致
した用語に対しては、波形辞書に登録されている、当該
一致した音関連用語に対応する波形デ−タを音声波形と
して、テキストの合成音声音声波形中に結合して、或い
は、テキストの全文の音声波形と時間的に並列に、出力
する機能を有する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】この発明は、日本語テキスト
を合成音声に変換する日本語テキスト音声変換装置に関
するものである。

【０００２】

【従来の技術】日本語テキスト音声変換装置は、我々が
日常読み書きしている漢字かな混じり文を入力テキスト
として、このテキストを音声に変換し、変換された音声
を出力する装置である。従来装置の構成の概略を図１に
示す。この従来装置は、入力部１０から外部入力された
日本文テキストを音声変換する変換処理部１２を具えて
いる。この入力テキストは、変換処理部１２のテキスト
解析部１４に入力される。

【０００３】テキスト解析部１４では、入力された漢字
かな混じり文から音韻・韻律記号列を生成する。音韻・
韻律記号列とは、入力文の読み・アクセント・イントネ
ーション等を文字列として記述したもの（中間言語）で
ある。各単語の読みとアクセントは発音辞書１６に登録
されており、この辞書１６を参照しながら音額・韻律記
号列が生成される。例えば「猫がニャーと鳴いた」とい
うテキストが入力されると、テキスト解析部１４は、発
音辞書１６を参照し、従来周知の最長一致法により、す
なわち、表記が入力テキストと一致する最長の単語を用
いて、入力テキストを単語に分割する。こうして、入力
テキストは「猫（ネ’コ）」「が（ガ）」「ニャー（ニ
ャ’ー）」「と（ト）」「鳴い（ナイ）」「た（夕）」
という単語列に分割される。括弧（）内に示したのは、
その単語の辞書登録情報、すなわち、読みおよびアクセ
ントである。

【０００４】テキスト解析部１４は、この単語列の各単
語の辞書登録情報、すなわち、括弧（）内の情報を用い
て「ネ’コガ，ニャ’ート，ナイタ」という音韻・韻律
記号列を生成し、それを音声規則合成部１８に引き渡
す。音韻・韻律記号列中の「’」はアクセントの位置
を、および「，」はアクセント句の区切りをそれぞれ示
す。

【０００５】音声規則合成部１８は、音声素片デ−タが
格納されているメモリ２０を参照しながら、音韻・韻律
記号列に基づき合成波形を生成する。この合成波形がス
ピーカ２２を通して出力される。音声素片データは、そ
れを接続して合成波形をつくるための音声の基本単位で
あり、音の種類等に応じて様々な音声素片データがＲＯ
Ｍ等のメモリに蓄積されている。

【０００６】

【発明が解決しようとする課題】従来の日本語テキスト
音声変換装置は、入力された日本語テキストを合成音声
に変換してこの合成音声を出力するので、どのような日
本語テキストでも合成音声として読み上げられるという
利点を有している。しかし、出力される合成音声はまる
でアナウンサーが朗読しているかのように聞こえる。こ
のため、従来の合成音声は、聞いている人に単調な感じ
を与えてしまい、その結果、聞き手は、しばらくすると
聞き飽きたり疲れたりしてくるといった問題があつた。

【０００７】この発明は、上述した問題の解決を図るた
めになされたものである。

【０００８】この発明の目的は、聞く人が聞き飽きたり
疲れたりしない合成音声を出力する日本語テキスト音声
変換装置を提供することにある。

【０００９】この発明の他の目的は、テキストの用語中
から選ばれた音関連用語の合成音声波形を、実録音声波
形で置き換えて、全体の合成音声を出力する日本語テキ
スト音声変換装置を提供することにある。

【００１０】この発明のさらに他の目的は、テキスト用
語の全体の合成音声波形と、テキストの用語中から選ば
れた音関連用語に関連する実録音声波形とを、双方同時
に出力させて、合成音声を出力する日本語テキスト音声
変換装置を提供することにある。

【００１１】

【課題を解決するための手段】この目的の達成を図るた
め、この発明の日本語テキスト音声変換装置は、下記の
ような構成を有する。

【００１２】この発明の装置は、テキスト−音声波形変
換処理部と、この変換処理部に個別に接続されたフレ−
ズ辞書および波形辞書とを具えている。この変換処理
は、外部から入力された任意の日本語テキストを音声波
形に変換する。このフレ−ズ辞書は、実録音の再生音と
して表現されるべき音関連用語、例えば擬声語、背景
音、歌詞、曲名等々の用語の表記が予め登録されてい
る。さらに、波形辞書は、実録音で得た、該音関連用語
に対応する波形デ−タが予め登録されている。

【００１３】さらに、変換処理部は、テキスト中の用語
とフレ−ズ辞書に登録されている音関連用語との照合が
一致した用語に対しては、波形辞書に登録されている、
当該一致した音関連用語に対応する実録音波形デ−タを
音声波形として出力させるように、構成してある。或い
はまた、好ましくは、テキストの全体の合成音声の音声
波形と実録音声波形デ−タとを、個別にかつ同時に、出
力させる構成としても良い。

【００１４】上述したこの発明の構成によれば、音関連
用語が、擬声語や歌詞等の場合には、テキストの合成音
声中に実録音声が挿入されて出力されるので、臨場感の
ある合成音声出力となる。

【００１５】又、上述したこの発明の構成によれば、音
関連用語が、背景音や曲名等の場合には、テキストの全
体の合成音声の出力と合わせて、実録音声がＢＧＭのよ
うに同時に出力されるので、聞き応えのある合成音声出
力となる。

【００１６】

【発明の実施の形態】以下、図を参照して、この発明の
テキスト音声変換装置の構成の実施の形態につき、説明
する。尚、各図は、この発明が理解出来る程度に概略的
に示してあるにすぎない。

【００１７】（１）第１の実施の形態（１−１）構成図２は、この発明による日本語テキスト音声変換装置の
構成例を示すブロック図である。この装置１００は、テ
キスト−音声波形変換処理部１１０と、この変換処理部
１１０にディジタル電気情報として入力テキストを入力
させるための外部入力デ−タ取り込み用の入力部１２０
と、この変換処理部１１０から出力される音声波形（合
成音声波形とも言う。）を出力する音声出力装置例えば
スピ−カ１３０とを具えている。

【００１８】さらに、この変換処理部１１０は、入力テ
キストをその音韻・韻律記号列に変えて出力するテキス
ト解析部１０２と、この音韻・韻律記号列を合成音声波
形に変換してスピ−カ１３０へと出力する音声規則合成
部１０４とを具えている。さらに、この変換処理部１１
０は、テキスト解析部１０２に結合されていてかつ単語
の読みとアクセントが登録されている発音辞書１０６
と、音声規則合成部１０４に結合されていてかつ音声素
片デ−タが格納されている、例えばＲＯＭ（リ−ド・オ
ンリ−・メモリ）といった音声波形メモリ（記憶装置）
１０８とを具えている。この音声規則合成部１０４は、
テキスト解析部１０２からの音韻・韻律記号列を、音声
素片デ−タに基づいて、合成音声波形に変換する。

【００１９】尚、第１の実施の形態及び後述する他の実
施の形態の各構成に設けられている発音辞書の登録内容
例を表１に示してある。表１では、表記と、その表記の
品詞と、その表記に対応する読み及びアクセントとが示
されている。

【００２０】

【表１】

【００２１】又、入力部１２０は、第１の実施の形態及
び後述する他の実施の形態の各構成に設けられている
が、周知の通り、光学式読み取り装置であっても、キ−
ボ−ドのような入力装置であって良く、又、これらの適
当な組み合わせ装置、その他の任意好適な入力手段とし
て構成し得る。

【００２２】この発明の装置１００は、さらに、テキス
ト解析部１０２に結合されたフレ−ズ辞書１４０と、音
声規則合成部１０４に結合された波形辞書１５０とを具
えている。フレ−ズ辞書１４０は、実録音の再生音とし
て表現されるべき音関連用語が予め格納すなわち登録さ
れている。この構成例では、音関連用語を擬声語とし、
従って、フレ−ズ辞書１４０を擬声語辞書とする。この
擬声語辞書１４０には、擬声語の表記とこの擬声語に対
応する波形ファイル名とが記述されている。

【００２３】表２は、擬声語辞書の登録内容の一例を示
す表である。表２には、「ニャー」（猫の鳴き声の擬声
語）、「ワンワン」（犬の鳴き声の擬声語）、「ピンポ
ン」（チャイムの音の擬声語）、「カキーン」（バット
に硬球が当たった音の擬声語）等の表記とその表記に対
応する波形ファイル名が例示されている。

【００２４】

【表２】

【００２５】波形辞書１５０には、擬声語辞書１４０に
記述された音関連用語に対応する、実録音で得た波形デ
−タが波形ファイルとして格納されている。波形ファイ
ルは実際に音や声を録音した原音データである。例え
ば、表記「ニャー」の波形ファイル“ＣＡＴ．ＷＡＶ”
には猫の鳴き声を録音した音声波形が格納されている。
尚、録音して得られた音声波形を実録音声波形又は自然
音声波形とも言う。

【００２６】変換処理部１１０は、入力されたテキスト
の用語中に、フレ−ズ辞書１４０に登録されている音関
連用語と一致する用語があると、当該用語の波形デ−タ
として、音声素片デ−タを合成して得られる合成音声波
形の代わりに、当該用語の実録音声波形デ−タで置き換
えて出力する機能を有している。

【００２７】尚、変換処理部１１０は、第１メモリ１６
０を具えている。この第１メモリ１６０は、テキスト解
析部１０２や音声規則合成部１０４での処理において必
要な、或いは、この処理で生成された情報やデ−タを一
時的に保存するためのメモリである。この構成例では、
この第１メモリ１６０は、テキスト解析部１０２及び音
声規則合成部１０４に共用のメモリとして設けてある
が、この第１メモリ１６０を、テキスト解析部１０２及
び音声規則合成部１０４に対して、その内部或いは外部
に、個別に設けても良く、いずれの箇所に設けるかは設
計上の問題である。

【００２８】（１−２）動作次に、図２の構成例の日本語テキスト音声変換装置の動
作につき、具体例を挙げて説明する。図３は、合成音声
波形と、擬声語の実録音声波形とを結合する例を説明す
るための説明図である。図４および図５は、この動作の
説明に供するテキスト解析部の動作フロ−図、および図
６および図７は、この動作の説明に供する音声規則合成
部の動作フロ−図である。これら動作フロ−図におい
て、各処理ステップを記号Ｓに数字を添えて示す。

【００２９】例えば、日本語入力テキストが「猫がニャ
ーと鳴いた」である場合を考える。入力テキストが入力
部１２０で読み込まれてテキスト解析部１０２に入力さ
れる。

【００３０】テキスト解析部１０２は、入力テキストが
入力されたかどうか判断する（図４のＳ１）。入力が確
認されると、入力テキストを第１メモリ１６０に一旦格
納する（図４のＳ２）。

【００３１】次に、従来周知の最長一致法により、すな
わち、表記が入力テキストと一致する最長の単語を用い
て、入力テキストを単語に分割する。この最長一致法の
処理は、次の通りである。

【００３２】解析しようとする入力テキストの先頭に、
テキストポンインタｐをセットして、テキストポインタ
の初期化を行う（図４のＳ３）。

【００３３】次に、テキスト解析部１０２により、ポイ
ンタｐを先頭にして入力テキストと表記（見出し）がマ
ッチし（表記マッチング法）かつ接続条件を満たす単語
の有無を調べるために、発音辞書１０６および擬声語辞
書１４０を検索する（図４のＳ４）。接続条件とは、文
頭なら文頭として存在出来るか、文中なら直前の単語と
文法的に接続可能であるか、などという条件のことであ
る。

【００３４】この接続条件を満たす単語が発音辞書また
は擬声語辞書に見つかるかどうか、すなわち、単語候補
が得られるかどうかを検索する（図４のＳ５）。この検
索で単語候補が見つからなければ、バックトラック（図
４のＳ６）して、後述するステップ（Ｓ１２）へ進む。
尚、バックトラックとは、ポインタｐを直前の単語の先
頭まで戻し、その単語の次候補を用いて解析を試みるこ
とである。

【００３５】次に、単語候補が得られた場合には、単語
候補の中から最長の単語すなわち用語（用語には、単語
や言い回し等の種々の表現を含む。）を選択する（図４
のＳ７）。この場合、長さの同じ単語候補からは、好ま
しくは、自立語よりも付属語を優先して選択する。又、
単語候補が１つしか無い場合には、好ましくは、その単
語をそのまま選択する。

【００３６】次に、選択された単語が、擬声語辞書１４
０に登録されている音関連用語であるかどうかを調べる
ため、擬声語辞書１４０の参照すなわち検索を行う（図
５のＳ８）。この検索も、この辞書１４０に対して、表
記マッチング法により行う。

【００３７】なお、発音辞書１０６と擬声語辞書１４０
の両方に表記が同じ単語すなわち用語が登録されている
場合には、擬声語辞書１４０に登録された単語すなわち
音関連用語の方を用いることにする。

【００３８】選択された単語が擬声語辞書１４０に登録
されている場合には、この辞書１４０から波形ファイル
名を読出して、この単語表記と一緒に第１メモリ１６０
に一旦格納する（図５のＳ９およびＳ１１）。

【００３９】一方、選択された単語が、擬声語辞書１４
０に登録されていない非登録単語である場合には、発音
辞書１０６からこの非登録単語に対応する読みとアクセ
ントとを読出して、第１メモリ１６０に一旦格納する
（図５のＳ１０およびＳ１１）。

【００４０】選択した単語の長さだけテキストポインタ
ｐを進めて、テキストポインタｐが入力テキストの文末
に来るまで、上述した解析を繰り返し行って、入力テキ
ストの文頭から文末までを単語すなわち用語に分割する
（図５のＳ１２）。

【００４１】テキストの終端まで解析処理が終えていな
い場合には、ステップＳ４に戻り、終了している場合に
は、第１メモリ１６０から各単語の読みとアクセントを
読出して入力テキストを単語毎に区切られた単語列にす
ると共に、波形ファイル名を読出す。この場合、「猫が
ニャーと鳴いた」は、「猫｜が｜ニャー｜と｜鳴い｜
た」という単語に区切られる。尚、記号「｜」は、単語
の区切りを表記する記号であり、文章表現上で使用した
にすぎず、実際にこの表記が区切り情報として付されて
いるわけではない。

【００４２】次に、テキスト解析部１０２において、こ
の単語列は、その単語列中の擬声語が、波形ファイル名
で置換されて、他の単語は読みとアクセントに基づい
て、音韻・韻律記号列が生成される（図５のＳ１３）。

【００４３】この入力テキストの各単語と、読みおよび
アクセントとを単語毎に関係付けて表すと、入力テキス
トは、「猫（ネ’コ）」「が（ガ）」「ニャー（“ＣＡ
Ｔ．ＷＡＶ”）」「と（ト）」「鳴い（ナイ）」「た
（夕）」という単語列に分割される。括弧（）内に示し
たのは、その単語の両辞書１０２および１４０の辞書登
録情報であり、すなわち、既に説明した通り、発音辞書
１０６の登録単語の場合は読みとアクセント、および凝
声語辞書１４０の登録単語の場合は波形ファイル名であ
る。

【００４４】テキスト解析部１０２は、この単語列の各
単語の辞書登録情報、すなわち、括弧（）内の情報を用
いて「ネ’コガ，“ＣＡＴ．ＷＡＶ”ト，ナイタ」とい
う音韻・韻律記号列を生成し、これを図示されていない
メモリに一旦登録する（図５のＳ１４）。

【００４５】尚、音韻・韻律記号列は、単語列に基づい
て生成されるが、単語列の先頭から生成される。基本的
には、各単語の辞書登録情報を先頭からつなぎ合わせて
生成するが、アクセント区切りの位置には、「，」の記
号が挿入される。

【００４６】次に、この音韻・韻律記号列をメモリから
順次読出して、それを音声規則合成部１０４に送る。

【００４７】音声規則合成部１０４は、受け取った音韻
・韻律記号列「ネ’コガ，“ＣＡＴ．ＷＡＶ”ト，ナイ
タ」に基づき、音声素片データが格納されている音声波
形メモリ１０８から当該音声素片デ−タを読出してき
て、合成音声波形を生成する。この場合の処理手順につ
き説明する。

【００４８】まず、テキストの先頭音節に対応する記号
列から読出しを行う（図６のＳ１５）。この読出された
音韻・韻律記号列の各記号が波形ファイル名であるかど
うかを順次判定する（図６のＳ１６）。

【００４９】記号列中の記号が波形ファイル名でない場
合には、音声波形メモリ１０８にアクセスして、その記
号に対応する音声素片デ−タの検索を行う（図６のＳ１
７およびＳ１８）。

【００５０】その記号に対応する音声素片デ−タがある
場合には、それに対応する合成音声波形を読み出して、
第１メモリ１６０に一旦格納する（図６のＳ１９）。

【００５１】一方、記号列中に波形ファイル名が存在す
る場合には、波形辞書１５０にアクセスして、その波形
ファイル名に対応する波形デ−タを検索する（図６のＳ
２０およびＳ２１）。

【００５２】波形辞書１５０から波形デ−タ（すなわち
録音音声波形又は実録音声波形）を読み出して、第１メ
モリ１６０に一旦格納する（図６のＳ２２）。

【００５３】この動作例では、記号列中に“ＣＡＴ．Ｗ
ＡＶ”が挿入されているので、「ネ’コガ，」の合成音
声波形を生成した後、波形辞書１５０から波形ファイル
“ＣＡＴ．ＷＡＶ”の実録音声波形が読み出される。従
って、これら生成済みの合成音声波形と実録音声波形と
を第１メモリ１６０から読出してきて、両波形を配列順
序通りに連結（又は結合とも言う。）して、合成音声波
形を生成し、これを第１メモリ１６０に一旦格納する
（図７のＳ２３およびＳ２４）。

【００５４】音韻・韻律記号列に対する波形読出しが完
了していない場合には（図７のＳ２５）、次音節の記号
列の読出しを行って（図７のＳ２６）、ステップＳ１６
へ戻り、同様にして、波形の読出しを行う。

【００５５】その結果、その後に「ト，ナイタ」の合成
音声波形がメモリ１０８の音声素片データから生成され
るので、この波形を生成済の「ネ’コガ，“ＣＡＴ．Ｗ
ＡＶ”」の合成音声波形に結合する（Ｓ１６からＳ２
５）。最終的に、この入力テキストに対応した全ての合
成音声波形が出力される（図７のＳ２７）。

【００５６】図３は、この入力テキストの変換処理結果
を説明するための、合成音声波形図である。この合成音
声波形では、音関連用語「ニャー」の擬声語の部分の合
成音声が、自然音声波形に置き換えらる状況を示してい
る。すなわち、「ニャー」に対応する用語の位置に自然
音声波形が埋め込み結合されて、入力テキスト全体の合
成音声波形が形成されている。

【００５７】音韻・韻律記号列中に波形ファイル名が複
数個埋め込まれている場合は、その全ての個所に対して
同様の処理、すなわち、波形ファイルからの波形読み出
しと生成済波形への結合を行なう。音韻・韻律記号列中
に波形ファイル名が１つも埋め込まれていない場合は、
音声規則合成部１０４の動作は、従来技術と同じ動作と
なる。

【００５８】このようにして出来上がった入力テキスト
全体の合成音声波形がスピーカ１３０から合成音声とし
て出力される。

【００５９】（１−３）効果この発明の装置１００を用いることにより、実際に録音
した音で入力テキスト中の擬声語の部分を出力すること
ができるので、入力テキスト全てを合成音で出力した場
合と比べて、臨場感あふれる合成音となり、聞いていて
飽きたり疲れたりすることがない。

【００６０】（２）第２の実施の形態（２−１）構成次に、図８〜図１４を参照して、この発明の日本語テキ
スト音声変換装置の第２の実施形態につき説明する。図
８は、図２と同様に構成された、この装置の構成例を示
すブロック図である。この装置２００も、図２に示され
た構成と同様に接続された、変換処理部２１０と、入力
部２２０と、フレ−ズ辞書２４０と、波形辞書２５０
と、スピ−カ２３０とを具えている。又、変換処理部２
１０は、図２に示された構成と同様に接続された、テキ
スト解析部２０２と、音声規則合成部２０４と、発音辞
書２０６と、音声素片デ−タを格納するための音声波形
メモリ２０８と、上述した第１メモリ１６０と同様な役
割を果たす第１メモリ２６０を具えている。

【００６１】しかし、これらフレ−ズ辞書２４０および
波形辞書２５０は、それぞれ、第１の実施の形態の場合
とは、登録内容が多少異なっており、又、変換処理部２
１０を構成するテキスト解析部２０２および音声規則合
成部２０４は、それぞれ、第１の実施の形態の場合と
は、機能が多少異なっている。すなわち、この変換処理
部２１０は、テキスト中の用語とフレ−ズ辞書に登録さ
れている音関連用語との照合が一致した場合には、波形
辞書に登録されている当該音関連用語に対応する波形デ
−タを、テキストの音声波形と重畳させて出力させる機
能を有している。

【００６２】このテキスト音声変換装置２００において
は、テキスト解析部２０２に結合されているフレ−ズ辞
書２４０には、背景音の状況を表現する音関連用語が、
登録情報として、登録されている。この辞書２４０に
は、この登録情報として、音関連用語の表記すなわち背
景音の表記と、この表記に対応する波形ファイル名とが
記述されている。従って、このフレ−ズ辞書２４０を背
景音辞書として構成してある。

【００６３】表３は、背景音辞書２４０の登録内容の一
例を示す表である。表３には、「しとしと」（雨の降る
様子の表記）、「ざあざあ」（雨の降る様子の表記）、
「わいわい」（人が騒いでいる様子の表記）、「がやが
や」（人が騒いでいる様子の表記）等の表記とその表記
に対応する波形ファイル名が例示されている。

【００６４】

【表３】

【００６５】波形辞書２５０には、背景音辞書２４０に
記述された音関連用語に対応する、実録音で得た波形デ
−タが波形ファイルとして格納されている。波形ファイ
ルは実際に音や声を録音した原音データである。例え
ば、表記「しとしと」の波形ファイル“ＲＡＩＮ１．Ｗ
ＡＶ”には「しとしと」と雨が降る音を録音した実録音
声波形が格納されている。

【００６６】（２−２）動作次に、図８の構成例の日本語テキスト音声変換装置の動
作につき、具体例を挙げて説明する。図９は、テキスト
全体の合成音声波形と、背景音の実録音声波形（すなわ
ち自然音声波形）との重畳例を説明する図、すなわち、
テキスト全体の合成音声波形と、背景音の実録音声波形
とを、互いに個別に、しかも、時間的に並列に、出力す
る例を説明するための説明図である。図１０および図１
１は、この動作の説明に供するテキスト解析部のフロ−
図、および図１２〜図１４は、この動作の説明に供する
音声規則合成部のフロ−図である。

【００６７】例えば、日本語入力テキストが「雨がしと
しと降っていた」である場合を考える。入力テキストが
入力部２２０で読み込まれてテキスト解析部２０２に入
力されると、第１の実施の形態で説明したと同様に、従
来周知の最長一致法により、入力テキストを単語に分割
する。この単語分割して音韻・韻律記号列を生成するま
での処理は、図４および図６を参照して説明したのとほ
ぼ同様なステップを得て行われるが、以下、説明する。

【００６８】テキスト解析部２０２は、入力テキストが
入力されたかどうか判断する（図１０のＳ３０）。入力
が確認されると、入力テキストを第１メモリ２６０に一
旦格納する（図１０のＳ３１）。

【００６９】次に、従来周知の最長一致法により、すな
わち、表記が入力テキストと一致する最長の単語を用い
て、入力テキストを単語に分割する。この最長一致法の
処理は、次の通りである。

【００７０】解析しようとする入力テキストの先頭に、
テキストポンインタｐをセットして、テキストポインタ
の初期化を行う（図１０のＳ３２）。

【００７１】次に、テキスト解析部２０２により、ポイ
ンタｐを先頭にして入力テキストと表記（見出し）がマ
ッチし（表記マッチング法）かつ接続条件を満たす単語
の有無を調べるために、発音辞書２０６を検索する（図
１０のＳ３３）。

【００７２】この接続条件を満たす単語が発音辞書に見
つかるかどうか、すなわち、単語候補が得られるかどう
かを検索する（図１０のＳ３４）。この検索で単語候補
が見つからなければ、バックトラック（図１０のＳ３
５）して、後述するステップ（Ｓ４１）へ進む。

【００７３】次に、単語候補が得られた場合には、単語
候補の中から最長の単語すなわち用語（用語には、単語
や言い回し等の種々の表現を含む。）を選択する（図１
０のＳ３６）。この場合、長さの同じ単語候補からは、
好ましくは、自立語よりも付属語を優先して選択する。
又、単語候補が１つしか無い場合には、好ましくは、そ
の単語をそのまま選択する。

【００７４】次に、選択された単語が、背景音辞書２４
０に登録されている音関連用語であるかどうかを調べる
ため、背景音辞書２４０の参照すなわち検索を行う（図
１１のＳ３７）。この検索も、この辞書２４０に対し
て、表記マッチング法により行う。

【００７５】選択された単語が背景音辞書２４０に登録
されている場合には、この辞書２４０から波形ファイル
名を読出して、この単語表記と一緒に第１メモリ２６０
に一旦格納する（図１１のＳ３８およびＳ４０）。

【００７６】一方、選択された単語が、背景音辞書２４
０に登録されていない非登録単語である場合には、発音
辞書２０６からこの非登録単語に対応する読みとアクセ
ントとを読出して来て、第１メモリ２６０に一旦格納す
る（図１１のＳ３９およびＳ４０）。

【００７７】選択した単語の長さだけテキストポインタ
ｐを進めて、テキストポインタｐが入力テキストの文末
に来るまで、上述した解析を繰り返し行って、入力テキ
ストの文頭から文末までを単語すなわち用語に分割する
（図１１のＳ４１）。

【００７８】テキストの終端まで解析処理が終えていな
い場合には、ステップＳ３３に戻り、終了している場合
には、メモリから各単語の読みとアクセントを読出して
入力テキストを単語毎に区切られた単語列にすると共
に、波形ファイル名を読出す。この場合、「雨がしとし
と降つていた」は、「雨｜が｜しとしと｜降っ｜て｜い
｜た」という単語に区切られる。

【００７９】次に、テキスト解析部２０２において、こ
の単語列は、その単語列中の背景音が、波形ファイル名
で置換されて、他の単語は読みとアクセントに基づい
て、音韻・韻律記号列が生成される（図１１のＳ４
２）。

【００８０】この入力テキストの各単語と、読みおよび
アクセントとを単語毎に関係付けて表すと、入力テキス
トは、「雨（ア’メ）」「が（ガ）」「しとしと（シ
ト’シト）」「降っ（フ’ッ）」「て（テ）」「い
（イ）」「た（夕）」という単語列に分割される。括弧
（）内に示したのは、その単語の辞書登録情報、すなわ
ち、読みとアクセントである。

【００８１】このように、テキスト解析部２０２は、こ
の単語列の各単語の辞書登録情報、すなわち、括弧（）
内の情報を用いて「ア’メガ，シト’シト，フ’ッテイ
タ」という音韻・韻律記号列を生成する。一方、テキス
ト解析部２０２は、背景音辞書２４０（図８）を参照し
てこの単語列中の単語が背景音辞書２４０に登録されて
いないかどうかを調べる。すると、「しとしと（ＲＡＩ
Ｎ１．ＷＡＶ）」が登録されているので、対応する波形
ファイル名ＲＡＩＮ１．ＷＡＶ：を音韻・韻律記号列の
先頭に加えて「ＲＡＩＮ１．ＷＡＶ：ア’メガ，シト’
シト，フ’ッテイタ」という音韻・韻律記号列に変更
し、これを第１メモリ２６０に一旦登録する（図１１の
Ｓ４３）。その後、この波形ファイル名付き音韻・韻律
記号列を音声規則合成部２０４に送る。

【００８２】尚、背景音辞書２４０に登録された背景音
の単語が単語列中に複数個含まれている場合は、生成し
た音韻記号列の先頭に、対応する波形ファイル名を全て
付加する。背景音辞書２４０に登録された背景音の単語
が単語列中に１つも含まれていない場合は、生成した音
韻・韻律記号列をそのまま音声規則合成部２０４に送
る。

【００８３】音声規則合成部２０４は、受け取った音韻
・韻律記号列「ＲＡＩＮｌ．ＷＡＶ：ア’メガ，シト’
シト，フ’ッテイタ」に基づき、音声素片データが格納
されている音声波形メモリ２０８から当該音声素片デ−
タを読出してきて、合成音声波形を生成する。この場合
の処理手順につき説明する。

【００８４】まず、テキストの先頭音節に対応する記号
列から読出しを行う。音声規則合成部２０４は、読みと
アクセントの音韻・韻律記号列の先頭に波形ファイル名
が付いているかどうかを判断する。音韻・韻律記号列の
先頭に波形ファイル“ＲＡＩＮ１．ＷＡＶ”が付加され
ているので、「ア’メガ，シト’シト，フ’ッテイタ」
の波形を音声素片データ２０８から生成した後、波形辞
書２５０から波形ファイル“ＲＡＩＮｌ．ＷＡＶ”の波
形を読み出し、この波形と生成済の「ア’メガ，シト’
シト，フ’ッテイタ」の波形とを、波形の開始点から、
同時に出力、すなわち重畳させて出力する。

【００８５】この場合、“ＲＡＩＮ１．ＷＡＶ”の波形
が「ア’メガ，シト’シト，フ’ッテイタ」の波形より
長い場合は、前者を後者の時間的長さで打ち切って同時
に出力する。この場合には、打ち切りという簡単な処理
で合成音声波形と背景音の波形デ−タとを重畳させるこ
とが出来る。

【００８６】逆に、“ＲＡＩＮ１．ＷＡＶ”の波形が
「ア’メガ，シト’シト，フ’ッテイタ」の波形より短
い場合は、後者の長さになるまで前者を繰り返し連続さ
せて足し合わせる。この場合には、背景音の波形デ−タ
が合成音声波形よりも早く終わってしまうのを防ぐこと
が出来る。

【００８７】音韻・韻律記号列の先頭に波形ファイル名
が複数個付加されている場合は、その全てに対して同様
の処理、すなわち、波形ファイルからの波形読み出しと
生成済波形への足し合わせを行なう。例えば、音韻・韻
律記号列の先頭にＲＡＩＮ１．ＷＡＶ：ＬＯＵＤ．ＷＡ
Ｖ：が付加されていれば、雨の音と雑踏の音の両方の波
形が合成音波形に足し合わされる。音韻・韻律記号列の
先頭に波形ファイル名が１つも付加されていない場合
は、音声規則合成部２０４の動作は従来技術と同じとな
る。

【００８８】以上の処理動作は、次のようにして行われ
る。まず、テキストの先頭音節に対応する記号列から読
出しを行う（図１２のＳ４４）。

【００８９】この読出しにより、波形ファイル名が記号
列の先頭に付されていると判断する。その結果、この音
声規則合成部２０４は、メモリ２０８にアクセスを行っ
て、波形ファイル名に続く読み及びアクセントの音韻・
韻律記号列の各記号に対応する音声素片デ−タの検索を
行う（図１２のＳ４５及びＳ４６）。

【００９０】その記号に対応する音声素片デ−タがある
場合には、それに対応する合成音声波形を読み出して、
第１メモリ２６０に一旦格納する（図１２のＳ４７及び
Ｓ４８）。

【００９１】各記号に対応する合成音声波形が、読み出
された順に次々と連結されて、連結された結果が第１メ
モリ２６０に一旦格納される（図１２のＳ４９及びＳ５
０）。

【００９２】次に、音声規則合成部２０４は、「ア’メ
ガ，シト’シト，フ’ッテイタ」という音韻・韻律記号
列の一文全体の合成音声波形が生成されたか否かを判断
する（図１２のＳ５１）。この判断の結果、まだ、一文
全体の合成音声波形が生成されていないと判断された場
合には、次音節対応記号列の読出しを指令し（図１２の
Ｓ５２）、ステップＳ４５に戻る。

【００９３】一文全体の合成音声波形が生成済みである
と判断された場合には、音声規則合成部２０４は、波形
ファイル名を読出す（図１３のＳ５３）。ここで説明す
る例の場合には、波形ファイル名がある場合であるの
で、波形辞書２５０にアクセスを行って、波形デ−タの
検索を行う（図１３のＳ５４及びＳ５５）。

【００９４】この検索の結果、当該波形ファイル名に対
応する背景音波形を波形辞書２５０から読出してきて、
第１メモリ２６０に一旦格納する（図１３のＳ５６及び
Ｓ５７）。

【００９５】次に、波形ファイル名に対応する背景音の
読出しが終了すると、波形ファイル名が１つか或いは複
数あるかどうかを判定する（図１３のＳ５８）。１つし
か波形ファイル名がない場合には、その背景音波形を第
１メモリ２６０から読出し（図１３のＳ５９）、又、も
し、複数の波形ファイル名が存在する場合には、これら
に対応する背景音の全てをメモリから同時に読出す（図
１３のＳ６０）。

【００９６】これらの背景音の読出しが終了すると、或
いはこの読出しと同時に、既に生成済みの合成音声波形
を第１メモリ２６０から読出す（図１４のＳ６１）。

【００９７】背景音波形及び合成音声波形の双方の読出
しが完了すると、背景音波形及び合成音声波形の双方の
長さの比較を行う（図１４のＳ６２）。

【００９８】背景音波形及び合成音声波形の双方の時間
的長さが等しい場合には、背景音波形及び合成音声波形
の双方を時間的に並列に、すなわち同時に、音声規則合
成部２０４から出力させる。

【００９９】背景音波形及び合成音声波形の双方の時間
的長さが等しくない場合には、合成音声が背景音よりも
長いかどうかを判定する（図１４のＳ６４）。背景音波
形が合成音声波形よりも短い場合には、合成音声波形の
出力と同時に、背景音波形を合成音声の長さと一致する
まで繰り返して出力させる（図１４のＳ６５及びＳ６
３）。

【０１００】一方、背景音波形が合成音声波形よりも長
い場合には、合成音声波形の出力と同時に、背景音波形
を合成音声波形の長さと一致する長さで打ち切って出力
させる（図１４のＳ６６及びＳ６３）。

【０１０１】以上のようにして、背景音波形及び合成音
声波形の双方を重畳させて、音声規則合成部２０４から
スピ−カ２３０へと、出力させることが出来る。

【０１０２】尚、入力テキスト中に、背景音に関する音
関連用語が含まれていないため、音韻・韻律記号列の先
頭に波形ファイル名が付されていない場合には、ステッ
プＳ３７からステップＳ３９に進む。そして、ステップ
Ｓ５３において、波形ファイル名がないので、音声規則
合成部２０４は、合成音声波形のみを読み出してきて合
成音声のみを出力する（図１３のＳ６８及びＳ６９）。

【０１０３】図９に重畳例を示す。この構成例では、
「雨がしとしと降っていた」の合成音声波形の出力と同
時に、背景音の自然音声波形が出力されている状態を示
している。すなわち、合成音声波形の開始点から終点ま
での同一期間に、背景音の自然音声波形が出力されてい
る。

【０１０４】このようにして出来上がった入力テキスト
全体の波形がスピーカ２３０から出力される。

【０１０５】（２−３）効果この発明の装置２００を用いることにより、実際に録音
した音を合成音の背景音として出力することができるの
で、入力テキストを合成音のみで出力した場合と比べ
て、臨場感あふれる合成音となり、このため、合成音を
聞いていて飽きたり疲れたりすることがない。又、この
装置２００によれば、簡単な処理により、テキストの合
成音声波形に背景音などの実録音の波形デ−タを重畳さ
せることが出来る。

【０１０６】（３）第３の実施の形態（３−１）構成次に、図１５〜図１９を参照して、この発明による日本
語テキスト音声変換装置の第３の実施の形態につき説明
する。図１５は、図２と同様に構成された、この装置の
構成例を示すブロック図である。この装置３００も、図
２に示された構成と同様に接続された、変換処理部３１
０と、入力部３２０と、フレ−ズ辞書３４０と、スピ−
カ３３０とを具えている。又、変換処理部３１０は、図
２に示された構成と同様に接続された、テキスト解析部
３０２と、音声規則合成部３０４と、発音辞書３０６
と、音声素片デ−タを格納するための音声波形メモリ３
０８と、上述した第１メモリ１６０と同様な役割を果た
す第１メモリ３６０を具えている。

【０１０７】この装置３００のフレ−ズ辞書３４０は、
第１及び第２の実施の形態の場合とは、登録内容が異な
っている。又、変換処理部３１０を構成するテキスト解
析部３０２及び音声規則合成部３０４は、それぞれ、第
１及び第２の実施の形態とは、機能が多少異なってい
る。

【０１０８】この装置３００の場合には、フレ−ズ辞書
３４０として、歌唱フレーズ辞書が設けられている。テ
キスト解析部３０２と結合されているこの歌唱フレ−ズ
辞書３４０には、歌唱フレーズの表記とそれに対応する
歌唱用音韻・韻律記号列が記述されている。歌唱用音韻
・韻律記号列とは歌詞と楽譜を記述した文字列であり、
例えば「アｃ２」はｃ（ド）の高さ、２分音符の長さで
「ア」を発声することを表わす。

【０１０９】又、この装置３００の場合には、音声規則
合成部３０４に結合されて歌唱用音韻・韻律記号列処理
部３５０が設けられている。この歌唱用音韻・韻律記号
列処理部３５０は、音声波形メモリ３０８とも結合され
ている。この歌唱用音韻・韻律記号列処理部３５０は、
歌唱用音韻・韻律記号列を解析して音声波形メモリ３０
８の音声素片データから歌声の合成音声波形を生成する
ために用いられる。

【０１１０】表４は、歌唱フレ−ズ辞書の登録内容の一
例を示す表である。表４には、「あんたがたどこさ」、
「さくらさくら」及び「ずいずいずっころばし」等とい
った歌唱の表記と、その表記に対する歌唱用音韻・韻律
記号列が例示されている。

【０１１１】

【表４】

【０１１２】歌唱用音韻・韻律記号列処理部３５０にお
いては、これに入力される歌唱用音韻・韻律記号列の解
析を行う。この解析処理により、例えば上述した「アｃ
２」は、音節「ア」の波形を直前の波形に連結する際
に、音の高さがｃ（ド）となるような、又、音の長さが
２分音符の長さになるような音節「ア」の波形を連結す
ることができる。つまり、同じ音声素片デ−タ「ア」を
用いて、普通の発声の「ア」と歌声の「ア」の双方の波
形を生成することが出来る。換言すれば、歌唱用音韻・
韻律記号列において、「ｃ２」のような記号が付加され
ている音節は、歌声として音声波形を生成し、一方、こ
のような記号が付加されていない音節は、普通の発声と
して音声波形を生成することになる。

【０１１３】上述した装置３００の変換処理部３１０
は、テキスト中の歌詞と歌唱フレ−ズ辞書に登録されて
いる登録歌詞との照合が一致した場合には、歌唱フレ−
ズ辞書に登録されている当該登録歌詞と対となっている
歌唱用音韻・韻律記号列に基づいて変換された音声波形
を、音声素片デ−タを合成して得られた歌詞の合成音声
波形の代わりに、歌詞の音声波形として出力させる機能
を有している。

【０１１４】（３−２）動作図１５の日本語テキスト音声変換装置３００の動作を具
体例を挙げて説明する。図１６は、テキストのうち歌詞
を除いた部分の合成音声波形と、歌声の合成音声波形と
の結合例を説明する図、すなわち、テキストの歌詞に対
応する合成音声波形の代わりに、歌声の合成音声波形を
埋め込み結合させて一つのまとまった合成音声波形とし
て出力する例を説明するための説明図である。図１７お
よび図１８は、この動作の説明に供するテキスト解析部
のフロ−図、および図１９は、この動作の説明に供する
音声規則合成部のフロ−図である。

【０１１５】例えば、日本語入力テキストが「彼はさく
らさくらと歌いました」である場合を考える。入力テキ
ストが入力部３２０で読み込まれてテキスト解析部３０
２に入力されると、第１の実施の形態で説明したと同様
に、従来周知の最長一致法により、入力テキストを単語
に分割する。この単語分割して音韻・韻律記号列を生成
するまでの処理は、図４および図５を参照して説明した
のとほぼ同様なステップを経て行われるが、以下、説明
する。

【０１１６】テキスト解析部３０２は、入力テキストが
入力されたかどうか判断する（図１７のＳ７０）。入力
が確認されると、入力テキストを第１メモリ３６０に一
旦格納する（図１７のＳ７１）。

【０１１７】次に、従来周知の最長一致法により、すな
わち、表記が入力テキストと一致する最長の単語を用い
て、入力テキストを単語に分割する。この場合の最長一
致法の処理は、次の通りである。

【０１１８】解析しようとする入力テキストの先頭に、
テキストポンインタｐをセットして、テキストポインタ
の初期化を行う（図１７のＳ７２）。

【０１１９】次に、テキスト解析部３０２により、ポイ
ンタｐを先頭にして入力テキストと表記（見出し）がマ
ッチし（表記マッチング法）かつ接続条件を満たす単語
の有無を調べるために、発音辞書３０６および歌唱フレ
−ズ辞書３４０を検索する（図１７のＳ７３）。

【０１２０】この接続条件を満たす単語が発音辞書また
は歌唱フレーズ辞書に見つかるかどうか、すなわち、単
語候補が得られるかどうかを検索する（図１７のＳ７
４）。この検索で単語候補が見つからなければ、バック
トラック（図１７のＳ７５）して、後述するステップ
（Ｓ８１）へ進む。

【０１２１】次に、単語候補が得られた場合には、単語
候補の中から最長の単語すなわち用語（用語には、単語
や言い回し等の種々の表現を含む。）を選択する（図１
７のＳ７６）。この場合、長さの同じ単語候補からは、
好ましくは、自立語よりも付属語を優先して選択する。
又、単語候補が１つしか無い場合には、好ましくは、そ
の単語をそのまま選択する。

【０１２２】次に、選択された単語が、歌唱フレ−ズ辞
書３４０に登録されている歌詞の用語であるかどうかを
調べるため、歌唱フレ−ズ辞書３４０の参照すなわち検
索を行う（図１８のＳ７７）。この検索も、この辞書３
４０に対して、表記マッチング法により行う。

【０１２３】なお、発音辞書３０６と歌唱フレ−ズ辞書
３４０の両方に表記が同じ単語すなわち歌詞が登録され
ている場合には、歌詞フレ−ズ辞書３４０に登録された
単語すなわち歌詞の用語の方を用いることにする。

【０１２４】選択された単語が歌唱フレ−ズ辞書３４０
に登録されている場合には、この辞書３４０からこの単
語に対応する歌唱用音韻・韻律記号列を読出して、この
単語表記と一緒に第１メモリ３６０に一旦格納する（図
１８のＳ７８およびＳ８０）。

【０１２５】一方、選択された単語が、歌唱フレ−ズ辞
書３４０に登録されていない非登録単語である場合に
は、発音辞書３０６からこの非登録単語に対応する読み
とアクセントとを読出し来て、第１メモリ３６０に一旦
格納する（図１８のＳ７９およびＳ８０）。

【０１２６】選択した単語の長さだけテキストポインタ
ｐを進めて、テキストポインタｐが入力テキストの文末
に来るまで、上述した解析を繰り返し行って、入力テキ
ストの文頭から文末までを単語すなわち用語に分割する
（図１８のＳ８１）。

【０１２７】テキストの終端まで解析処理が終えていな
い場合には、ステップＳ７３に戻り、終了している場合
には、第１メモリ３６０から各単語の読みとアクセント
を読出して入力テキストを単語毎に区切られた単語列に
すると共に、歌唱用音韻・韻律記号列を読出す。この場
合、「彼はさくらさくらと歌いました」は、「彼｜は｜
さくらさくら｜と｜歌い｜まし｜た」という単語に区切
られる。

【０１２８】次に、テキスト解析部３０２において、こ
の単語列は、その単語列中の歌詞が、歌唱用音韻・韻律
記号列で置換されて、他の単語は読みとアクセントに基
づいて、音韻・韻律記号列が生成され、第１メモリ３６
０に一旦格納される（図１８のＳ８２及びＳ８３）。

【０１２９】この入力テキストの各単語と、読みおよび
アクセントとを単語毎に関係付けて表すと、入力テキス
トは、「彼（カ’レ）」「は（ワ）」「さくらさくら
（サａ４クａ４ラｂ２サａ４クａ４ラｂ２）「と
（ト）」「歌い（ウタイ）」「まし（マ’シ）」「た
（夕）」という単語列に分割される。括弧（）内に示し
たのは、その単語の辞書登録情報であり、発音辞書３０
６の単語の場合は読みとアクセントに、歌唱フレーズ辞
書３４０の単語の場合は歌唱用音韻・韻律記号列になっ
ている。テキスト解析部３０２は、この単語列の各単語
の辞書登録情報、すなわち、括弧（）内の情報を用いて
「カ’レワ，サａ４クａ４ラｂ２サａ４クａ４ラｂ２
ト，ウタイマ’シタ」という音韻・韻律記号列を生成
し、それを音声規則合成部３０４に送る。

【０１３０】音声規則合成部３０４は、第１メモリ３６
０から音韻・韻律記号列「カ’レワ，サａ４クａ４ラｂ
２サａ４クａ４ラｂ２ト，ウタイマ’シタ」を、その先
頭音節対応記号列から順に、読み出す（図１９のＳ８
４）。

【０１３１】読み出された記号列が、歌唱用の記号列か
どうか、すなわち歌詞に対応する音韻・韻律記号列であ
るかどうかを判定する（図１９のＳ８５）。この判定に
より、歌唱用の記号列でないと判定されると、音声波形
メモリ３０８にアクセスが行われて当該記号列に対応す
る音声素片デ−タの検索が行われ、該当する音声素片デ
−タが見つかるまで行われる（図１９のＳ８６及びＳ８
７）。

【０１３２】当該記号列に対応する音声素片デ−タが検
索されると、この音声素片デ−タに該当する合成音声波
形が音声波形メモリ３０８から読み出されて第１メモリ
３６０に一旦格納される（図１９のＳ８８及びＳ８
９）。

【０１３３】先の音節の合成音声波形が既に第１メモリ
３６０に格納されている場合には、順次の合成音声波形
を結合すなわち連結させる（図１９のＳ９０）。

【０１３４】テキストの全文について合成音声波形の読
出しが完了していない場合にには（図１９のＳ９１）、
次音節対応記号列の読出し（図１９のＳ９２）を行って
ステップＳ８５に戻る。

【０１３５】「彼（カ’レ）」及び「は（ワ）」に対応
するそれぞれの記号列に対しこのような順次の処理を行
うことによって、「カ’レワ」に関して、従来通りの朗
読調の合成音声波形が生成される。この生成済みの合成
音声波形は、音声規則合成部３０４に引き渡されて、第
１メモリ３６０に格納される。

【０１３６】次に、「サａ４クａ４ラｂ２サａ４クａ４
ラｂ２」の記号列に対し読出しが行われる（図１９のＳ
９２）。

【０１３７】ステップＳ８５における歌唱用の記号列か
どうかの判定において、この音韻・韻律記号列「サａ４
クａ４ラｂ２サａ４クａ４ラｂ２」が歌唱用記号列であ
ると判定されると、この歌唱用記号列が歌唱用音韻・韻
列記号列処理部３５０に送られて、その解析が行われる
（図１９のＳ９３）。

【０１３８】この歌唱用音韻・韻律記号列処理部３５０
では歌唱用音韻・韻律記号列「サａ４クａ４ラｂ２サａ
４クａ４ラｂ２」が解析される。この処理部３５０にお
いて、記号列の各記号に対し解析が行われる。例えば、
「サａ４」は、音節「サ」に「ａ４」の記号が付いてい
るので、音節は歌声として、合成音声波形を生成し、し
かも、その音の高さ及び長さは、「ａ４」で決められた
高さ及び長さに指定される。

【０１３９】各記号に対するこのような解析結果に基づ
いて、音声波形メモリ３０８にアクセスを行って、その
解析結果に対応する音声素片デ−タの検索が行われる
（図１９のＳ９４及びＳ９５）。その結果、各記号に対
する音声素片デ−タから歌声の合成音声波形が生成され
る（図１９のＳ９６）。

【０１４０】この歌声の合成音声波形が音声規則合成部
３０４に引き渡されて、第１メモリ３６０に一旦格納さ
れる（図１９のＳ８９）。音声規則合成部３０４では、
受け取った歌声の合成音声波形を、生成済の「カ’レ
ワ」の合成音声波形に結合する（図１９のＳ９０）。

【０１４１】この後、「ト，ウタイマ’シタ」の記号列
につき順次上述したステップＳ８４からＳ９６までの処
理が行われる。その処理の結果、合成音声波形を従来通
り朗読調の合成音声波形として音声波形メモリ３０８の
音声素片データから生成する。この合成音声波形を生成
済の「カ’レワ，サａ４クａ４ラｂ２サａ４クａ４ラｂ
２」の合成音声波形に結合する。

【０１４２】尚、音韻・韻律記号列中に歌唱用音韻・韻
律記号列が複数個埋め込まれている場合は、その全ての
個所に対して同様の処理、すなわち、歌声合成音声波形
の生成と生成済波形への結合を行なう。

【０１４３】音韻・韻律記号列中に歌唱用音韻・韻律記
号列が１つも埋め込まれていない場合は、音声規則合成
部３０４の動作は従来技術と同じとなる。

【０１４４】このような処理の結果得られる合成音声波
形の一例は、図１６に示す通りとなる。図１６によれ
ば、「彼はさくらさくらと歌いました」のテキストのう
ち、「彼は」と「と歌いました」は、朗読調の合成音声
波形として出力され、「さくらさくら」の部分は、歌詞
であるので、その歌詞に対応する部分には、歌声の合成
音声波形として出力される。すなわち、「さくらさく
ら」の歌声の合成音声波形部分は、「彼は」と「と歌い
ました」の朗読調の合成音声波形部分の間に埋め込まれ
て、スピ−カ３３０に出力される（図１９のＳ９７）。

【０１４５】このようにして出来上がった入力テキスト
全体の合成音声波形がスピーカ３３０から出力される。

【０１４６】（３−３）効果この発明の装置３００を用いることにより、入力テキス
ト中の歌唱フレーズの部分を実際に歌って聞かせること
ができるので、入力テキストを全て朗読調で読み上げた
場合と比べて、聞く人にアピールする合成音声となり、
当該合成音声を聞いていて飽きたり疲れたりすることが
ない。

【０１４７】（４）第４の実施の形態（４−１）構成次に、図２０〜図２６を参照して、この発明の日本語テ
キスト音声変換装置の第４の実施の形態につき説明す
る。図２０は、この装置の構成例を示すブロック図であ
る。この装置４００も、図２に示された構成と同様に接
続された、変換処理部４１０と、入力部４２０と、スピ
−カ４３０とを具えている。

【０１４８】又、変換処理部４１０は、図２に示された
構成と同様に接続された、テキスト解析部４０２と、音
声規則合成部４０４と、発音辞書４０６と、音声素片デ
−タを格納するための音声波形メモリ４０８と、上述し
た第１メモリ１６０と同様な役割を果たす第１メモリ４
６０を具えている。

【０１４９】しかし、この装置４００の場合には、テキ
スト解析部４０２に結合された曲名辞書４４０と、音声
規則合成部４０４に結合された楽音波形生成部４５０と
を具えている。

【０１５０】曲名辞書４４０には、曲名が予め登録され
ている。すなわち、この曲名辞書４４０には、曲名の表
記とそれに対応する楽曲ファイル名が記述されている。
表５は、曲名辞書４４０の登録内容の一例を示す表であ
る。表５には、「仰げば尊し」、「君が代」、「七つの
子」等の曲タイトルの表記とその表記に対応する楽曲フ
ァイル名が例示されている。

【０１５１】

【表５】

【０１５２】この楽音波形生成部４５０は、これら曲名
に対応した楽音波形を生成する機能を有していて、楽音
波形変換部４５２と、この楽音波形変換部４５２に結合
されている楽曲辞書４５４を具えている。

【０１５３】楽曲辞書４５４には、曲名辞書４４０に登
録されている曲名に対応する演奏用の楽曲デ−タが予め
登録されている。すなわち、楽曲辞書４５４には、曲名
辞書４４０に記述された曲名の実際の楽曲ファイルが格
納されている。楽曲ファイルはＭＩＤＩ（Musical Inst
rument Digital Interface）形式のような規格化された
音楽データである。すなわち、ＭＩＤＩは、電子楽器間
のコミュニケ−ションを目的とした世界共通の周知の通
信プロトコルである。例えば”ＫＩＭＩＧＡＹＯ．ＭＩ
Ｄ”には「君が代」を演奏するＭＩＤＩデータが格納さ
れている。楽音波形変換部４５２は楽曲データ（ＭＩＤ
Ｉデータ）を楽音波形に変換して音声規則合成部４０４
に引き渡す機能を有している。

【０１５４】変換処理部４１０を構成するテキスト解析
部４０２および音声規則合成部４０４は、それぞれ、第
１〜第３の実施の形態の場合とは、機能が多少異なって
いる。すなわち、この変換処理部４１０は、テキスト中
の曲名を音声波形に変換する機能を有している。そし
て、この変換処理部４１０は、テキスト中の曲名と曲名
辞書４４０に登録されている登録曲名との照合が一致し
た場合には、楽音波形生成部４５０に登録されている当
該曲名に対応する楽曲データを楽音波形に変換して得ら
れる音声波形を、テキストの音声波形と重畳させて、す
なわち時間的に並列に、出力させる機能を有している。

【０１５５】（４−２）動作次に、図２０の構成例の日本語テキスト音声変換装置の
動作につき、具体例を挙げて説明する。図２１は、テキ
スト全体の合成音声波形と、楽音波形との重畳例を説明
する図、すなわち、テキスト全体の合成音声波形と、楽
音波形とを、互いに個別に、しかも、時間的に並列に、
出力する例を説明するための説明図である。図２２およ
び図２３は、この動作の説明に供するテキスト解析部の
フロ−図、および図２４〜図２６は、この動作の説明に
供する音声規則合成部のフロ−図である。

【０１５６】例えば、日本語入力テキストが「彼女は君
が代を唄い始めた」である場合を考える。入力テキスト
が入力部４２０で読み込まれてテキスト解析部４０２に
入力されると、第１の実施の形態で説明したと同様に、
従来周知の最長一致法により、入力テキストを単語に分
割する。この単語分割して音韻・韻律記号列を生成する
までの処理は、図４および図５を参照して説明したのと
ほぼ同様なステップを得て行われるが、以下、説明す
る。

【０１５７】テキスト解析部４０２は、入力テキストが
入力されたかどうか判断する（図２２のＳ１００）。入
力が確認されると、入力テキストを第１メモリ４６０に
一旦格納する（図２２のＳ１０１）。

【０１５８】次に、従来周知の最長一致法により、すな
わち、表記が入力テキストと一致する最長の単語を用い
て、入力テキストを単語に分割する。この最長一致法の
処理は、次の通りである。

【０１５９】解析しようとする入力テキストの先頭に、
テキストポンインタｐをセットして、テキストポインタ
の初期化を行う（図２２のＳ１０２）。

【０１６０】次に、テキスト解析部４０２により、ポイ
ンタｐを先頭にして入力テキストと表記（見出し）がマ
ッチし（表記マッチング法）かつ接続条件を満たす単語
の有無を調べるために、発音辞書４０６を検索する（図
２２のＳ１０３）。

【０１６１】この接続条件を満たす単語が発音辞書に見
つかるかどうか、すなわち、単語候補が得られるかどう
かを検索する（図２２のＳ１０４）。この検索で単語候
補が見つからなければ、バックトラック（図２２のＳ１
０５）して、後述するステップ（図２３のＳ１１１）へ
進む。

【０１６２】次に、単語候補が得られた場合には、単語
候補の中から最長の単語すなわち用語（用語には、単語
や言い回し等の種々の表現を含む。）を選択する（図２
２のＳ１０６）。この場合、長さの同じ単語候補から
は、好ましくは、自立語よりも付属語を優先して選択す
る。又、単語候補が１つしか無い場合には、好ましく
は、その単語をそのまま選択する。

【０１６３】次に、選択された単語が、曲名辞書４４０
に登録されている音関連用語すなわち曲名であるかどう
かを調べるため、曲名辞書４４０の参照すなわち検索を
行う（図２３のＳ１０７）。この検索も、この辞書４４
０に対して、表記マッチング法により行う。

【０１６４】選択された単語が曲名辞書４４０に登録さ
れている場合には、この辞書４４０から楽曲ファイル名
を読出して、この単語表記と一緒に第１メモリ４６０に
一旦格納する（図２３のＳ１０８およびＳ１１０）。

【０１６５】一方、選択された単語が、曲名辞書４４０
に登録されていない非登録単語である場合には、発音辞
書４０６からこの非登録単語に対応する読みとアクセン
トとを読出し来て、第１メモリ４６０に一旦格納する
（図２３のＳ１０９およびＳ１１０）。

【０１６６】選択した単語の長さだけテキストポインタ
ｐを進めて、テキストポインタｐが入力テキストの文末
に来るまで、上述した解析を繰り返し行って、入力テキ
ストの文頭から文末までを単語すなわち用語に分割する
（図２３のＳ１１１）。

【０１６７】テキストの終端まで解析処理が終えていな
い場合には、ステップＳ１０３に戻り、終了している場
合には、メモリから各単語の読みとアクセントを読出し
て入力テキストを単語毎に区切られた単語列にすると共
に、楽曲ファイル名を読出す。この場合、「彼女は君が
代を唄い始めた」は、「彼女｜は｜君が代｜を｜唄い｜
始め｜た」という単語に区切られる。

【０１６８】次に、テキスト解析部４０２において、こ
の単語列の各単語の読みとアクセントに基づいて、音韻
・韻律記号列が生成され、これが、第１メモリ４６０に
一旦格納される（図２３のＳ１１２及びＳ１１３）。

【０１６９】この入力テキストの各単語と、読みおよび
アクセントとを単語毎に関係付けて表すと、入力テキス
トは、「彼女（カ’ノジョ）」「は（ワ）」「君が代
（キミガヨ）」「を（ヲ）」「唄い（ウタイ）」「始め
（ハジ’メ）」「た（夕）」という単語列に分割され
る。括弧（）内に示したのは、その単語の辞書登録情
報、すなわち、読みとアクセントである。

【０１７０】このように、テキスト解析部４０２は、こ
の単語列の各単語の辞書登録情報、すなわち、括弧（）
内の情報を用いて「カ’ノジョワ，キミガヨヲ，ウタイ
ハジ’メタ」という音韻・韻律記号列を生成する。

【０１７１】一方、テキスト解析部４０２は、既に説明
したとおり、ステップＳ１０７において、曲名辞書４４
０を参照してこの単語列中の単語が曲名辞書４４０に登
録されていないかどうかを調べている。この例において
は、曲名「君が代（ＫＩＭＩＧＡＹＯ．ＭＩＤ）」（表
５参照）が登録されているので、対応する楽曲ファイル
名ＫＩＭＩＧＡＹＯ．ＭＩＤ：を音韻・韻律記号列の先
頭に加えて「ＫＩＭＩＧＡＹＯ．ＭＩＤ：カ’ノジョ
ワ，キミガヨヲ，ウタイハジ’メタ」という音韻・韻律
記号列に変更して、これを第１メモリ４６０に一旦格納
する（図２３のＳ１１２及びＳ１１３）。その後、楽曲
ファイル名付きの音韻・韻律記号列を音声規則合成部４
０４に送る。

【０１７２】尚、曲名辞書４４０に登録された曲名が単
語列に複数個含まれている場合には、生成した音韻・韻
律記号列の先頭に、対応する楽曲ファイル名を全て付加
する。曲名辞書４４０に登録された曲名が単語列に１つ
も含まれていない場合には、生成した音韻・韻律記号列
をそのまま音声規則合成部４０４に送る。

【０１７３】音声規則合成部４０４は、受け取った音韻
・韻律記号列「ＫＩＭＩＧＡＹＯ．ＭＩＤ：カ’ノジョ
ワ，キミガヨヲ，ウタイハジ’メタ」に基づき、音声素
片データが格納されている音声波形メモリ４０８から当
該音声素片デ−タを読出してきて、合成音声波形を生成
する。この場合の処理手順につき説明する。

【０１７４】まず、テキストの先頭音節に対応する記号
列から読出しを行う。音声規則合成部４０４は、読みと
アクセントの音韻・韻律記号列の先頭に楽曲ファイル名
が付いているかどうかを判断する。この例では、音韻・
韻律記号列の先頭に楽曲ファイル名“ＫＩＭＩＧＡＹ
Ｏ．ＭＩＤ”が付加されているので、「カ’ノジョワ，
キミガヨヲ，ウタイハジ’メタ」の波形を音声波形メモ
リ４０８の音声素片データから生成する。これと同時
に、楽音波形生成部４５０から楽曲ファイル名“ＫＩＭ
ＩＧＡＹＯ．ＭＩＤ”に対応する楽音波形を読出す。こ
の楽音波形と生成済の「カ’ノジョワ，キミガヨヲ，ウ
タイハジ’メタ」の合成音声波形とを、波形の開始点か
ら、同時に出力、すなわち重畳させて出力する。

【０１７５】この場合、“ＫＩＭＩＧＡＹＯ．ＭＩＤ”
の波形と「カ’ノジョワ，キミガヨヲ，ウタイハジ’メ
タ」の波形の時間的長さが異なっていても、前者を後者
の時間的長さで打ち切ることはしない。従って、前者と
後者を重畳出来る波形の長さは前者と後者のうち長い方
の長さとなる。ただし、前者の波形が後者の波形より短
い場合は、後者の長さになるまで前者を繰り返し連続さ
せて重畳させればよい。

【０１７６】音韻・韻律記号列の先頭に楽曲ファイル名
が複数個付加されている場合は、楽音波形生成部４５０
は全ての楽音波形を生成してこれらを順次に結合してか
ら、その楽音波形を音声規則合成部４０４に引き渡す。
音韻・韻律記号列の先頭に楽音ファイル名が１つも付加
されていない場合は、音声規則合成部４０４の動作は従
来技術と同じとなる。

【０１７７】以上の音声規則合成部４０４の処理動作
は、次のようにして行われる。まず、テキストの先頭音
節に対応する記号列から読出しを行う（図２４のＳ１１
４）。

【０１７８】この読出しにより、楽曲ファイル名が記号
列の先頭に付されていると判断する。その結果、この音
声規則合成部４０４は、音声波形メモリ４０８にアクセ
スを行って、楽曲ファイル名に続く読み及びアクセント
の音韻・韻律記号列の各記号に対応する音声素片デ−タ
の検索を行う（図２４のＳ１１５及びＳ１１６）。

【０１７９】その記号に対応する音声素片デ−タがある
場合には、それに対応する合成音声波形を読み出して、
第１メモリ４６０に一旦格納する（図２４のＳ１１７及
びＳ１１８）。

【０１８０】各記号に対応する合成音声波形が、読み出
された順に次々と連結されて、連結された結果が第１メ
モリ４６０に一旦格納される（図２４のＳ１１９及びＳ
１２０）。

【０１８１】次に、音声規則合成部４０４は、「カ’ノ
ジョワ，キミガヨヲ，ウタイハジ’メタ」という音韻・
韻律記号列の一文全体の合成音声波形が生成されたか否
かを判断する（図２４のＳ１２１）。この判断の結果、
まだ、一文全体の合成音声波形が生成されていないと判
断された場合には、次音節対応記号列の読出しを指令し
（図２４のＳ１２２）、ステップＳ１１５に戻る。

【０１８２】一文全体の合成音声波形が生成済みである
と判断された場合には、音声規則合成部４０４は、楽曲
ファイル名を読出す（図２５のＳ１２３）。ここで説明
する例の場合には、楽曲ファイル名がある場合であるの
で、楽音波形生成部４５０の楽曲辞書４５４にアクセス
を行って、楽曲デ−タの検索を行う（図２５のＳ１２４
及びＳ１２５）。

【０１８３】この例の場合には、音声規則合成部４０４
は、楽音波形変換部４５２に対して、楽曲ファイル名
“ＫＩＭＩＧＡＹＯ．ＭＩＤ”を伝える。これに応動し
て、楽音波形変換部４５２は、楽曲辞書４５４から楽曲
ファイル“ＫＩＭＩＧＡＹＯ．ＭＩＤ”のＭＩＤＩデ−
タの検索を行い、ＭＩＤＩデ−タを読出す（図２５のＳ
１２５及びＳ１２６）。

【０１８４】楽音波形変換部４５２は、このＭＩＤＩデ
−タを楽音波形に変換して、この楽音波形を音声規則合
成部４０４に引き渡し、そして第１メモリ４６０に一旦
格納する（図２５のＳ１２７及びＳ１２８）。

【０１８５】次に、楽曲ファイル名に対応する楽音波形
の読出しが終了すると、楽曲ファイル名が１つか或いは
複数あるかどうかを判定する（図２５のＳ１２９）。１
つしか楽曲ファイル名がない場合には、その楽音波形を
第１メモリ４６０から読出し（図２５のＳ１３０）、
又、もし、複数の楽曲ファイル名が存在する場合には、
これらに対応する楽音波形の全てを第１メモリ４６０か
ら順次に読出す（図２５のＳ１３１）。

【０１８６】これらの楽音波形の読出しが終了すると、
或いはこの読出しと同時に、既に生成済みの合成音声波
形を第１メモリ４６０から読出す（図２６のＳ１３
２）。

【０１８７】楽音波形及び合成音声波形の双方の読出し
が完了すると、楽音波形及び合成音声波形の双方を同時
に、スピ−カ４３０へと出力させる（図２６のＳ１３
３）。

【０１８８】尚、入力テキスト中に、曲名に関する音関
連用語が含まれていないため、音韻・韻律記号列の先頭
に楽曲ファイル名が付されていない場合には、ステップ
Ｓ１０７からステップＳ１０９に進む。そして、ステッ
プＳ１２３において、楽曲ファイル名がないので、音声
規則合成部４０４は、合成音声波形のみを読み出してき
て合成音声のみを出力する（図２５のＳ１３５及びＳ１
３６）。

【０１８９】図２１に重畳例を示す。この構成例では、
「彼女は君が代を唄い始めた」の合成音声波形の出力と
同時に、「君が代」の曲の楽音波形すなわち演奏音波形
が出力されている状態を示している。すなわち、合成音
声波形の開始点から終点までの同一期間に、曲の演奏音
波形が出力されている。

【０１９０】このようにして出来上がった入力テキスト
全体の、重畳された合成音声波形がスピーカ４３０から
出力される。

【０１９１】（４−３）効果この発明の装置４００を用いることにより、入力テキス
ト中で参照される楽曲を合成音のＢＧＭとして出力する
ことができるので、入力テキストを合成音声のみで出力
した場合と比べて、聞く人にアピールする合成音声とな
り、この合成音声を聞いていて飽きたり疲れたりするこ
とがない。

【０１９２】（５）第５の実施の形態（５−１）構成次に、図２７〜図２９を参照して、この発明の日本語テ
キスト音声変換装置の第５の実施の形態の構成例につ
き、説明する。

【０１９３】日本語テキスト中の用語には、引用符に囲
まれた用語が含まれている場合がある。特に、擬声語と
か、歌詞とか、曲名などといった用語の場合には、それ
らの用語を強調するためなどの理由で、引用符、例え
ば、「」、‘’、及び“”で囲まれたり、或いは、♪等
の特定記号が用語の前或いは後などに付けられている場
合がある。そこで、第５の実施の形態の装置は、この構
成例によれば、このようなテキスト文中のこれら引用符
に囲まれていたり、特定記号が前後のいずれかに付いて
いる用語のみを、合成音声波形の代わりに実録音の音声
波形で置き換えて出力させる構成を有している。

【０１９４】図２７は、この発明による日本語テキスト
音声変換装置の第５の実施の形態の構成例を示すブロッ
ク図である。この装置５００は、図２を参照して既に説
明した第１の実施の形態の構成例に適用判定部５７０を
追加した構成となっている。すなわち、この装置５００
においては、この適用判定部５７０を、図２で示したテ
キスト解析部１０２と擬声語辞書１４０との間に設けて
いる構成が図２の構成と異なるにすぎない。従って、こ
の第５の実施の形態の構成例は、介挿されている適用判
定部の構成及びその動作部分を除き、第１の実施の形態
で説明した構成例の場合と同様な構成及び動作を行う。
従って、第１の実施の形態の構成例と同様な構成要素に
ついては、同一の参照番号を付してその詳細な説明を省
略し、相違点につき説明する。

【０１９５】この適用判定部５７０は、テキスト中の用
語が、フレ−ズ辞書、すなわちこの構成例では擬声語辞
書１４０に登録されている登録用語との照合のための適
用条件を満たしているか否かを判定する。そして、この
適用判定部５７０は、適用条件を満たしている用語と一
致する音関連用語のみを当該フレ−ズ辞書１４０から変
換処理部１１０に読出す機能を有している。

【０１９６】この適用判定部５７０は、テキスト解析部
１０２及びフレ−ズ辞書１４０間に結合されている条件
判定部５７２と、この条件判定部５７２に結合されてい
てかつ適用条件として適用判定条件が予め登録されてい
るル−ル辞書５７４とを具えている。

【０１９７】適用判定条件とは、フレ−ズ辞書すなわち
擬声語辞書１４０に登録された擬声語が入力テキストに
現われた時に擬声語辞書１４０を用いるかどうかの条件
を記述したものである。

【０１９８】表６は、凝声語が特定の引用符に囲まれた
場合にのみ擬声語辞書１４０を用いるといった判定ル−
ルすなわち判定条件が記述されている。例えば、引用符
として、「」や“”や‘’や、特定記号として♪等が挙
げられている。

【０１９９】

【表６】

【０２００】（５−２）動作次に、図２７の構成例の日本語テキスト音声変換装置の
動作につき、具体例を挙げて説明する。図２８および図
２９は、この動作の説明に供するテキスト解析部のフロ
−図である。

【０２０１】例えば、日本語入力テキストが「猫が‘ニ
ャー’と鳴いた」である場合を考える。入力テキストが
入力部１２０で読み込まれてテキスト解析部１０２に入
力される。

【０２０２】テキスト解析部１０２は、入力テキストが
入力されたかどうか判断する（図２８のＳ１４０）。入
力が確認されると、入力テキストを第１メモリ１６０に
一旦格納する（図２８のＳ１４１）。

【０２０３】次に、従来周知の最長一致法により、すな
わち、表記が入力テキストと一致する最長の単語を用い
て、入力テキストを単語に分割する。この最長一致法の
処理は、次の通りである。

【０２０４】解析しようとする入力テキストの先頭に、
テキストポンインタｐをセットして、テキストポインタ
の初期化を行う（図２８のＳ１４２）。

【０２０５】次に、テキスト解析部１０２により、ポイ
ンタｐを先頭にして入力テキストと表記（見出し）がマ
ッチし（表記マッチング法）かつ接続条件を満たす単語
の有無を調べるために、発音辞書１０６および擬声語辞
書１４０を検索する（図２８のＳ１４３）。

【０２０６】次に、この接続条件を満たす単語が発音辞
書１０６または擬声語辞書１４０に見つかるかどうか、
すなわち、単語候補が得られるかどうかを検索する（図
２８のＳ１４４）。この検索で単語候補が見つからなけ
れば、バックトラック（図２８のＳ１４５）して、後述
するステップ（図２９のＳ１５１）へ進む。

【０２０７】次に、単語候補が得られた場合には、単語
候補の中から最長の単語すなわち用語（用語には、単語
や言い回し等の種々の表現を含む。）を選択する（図２
８のＳ１４６）。この場合、第１の実施の形態の構成例
の場合と同様に、長さの同じ単語候補からは、好ましく
は、自立語よりも付属語を優先して選択する。又、単語
候補が１つしか無い場合には、好ましくは、その単語を
そのまま選択する。

【０２０８】次に、文頭からの順次の処理により、選択
された単語毎に、この選択された単語が、擬声語辞書１
４０に登録されている音関連用語であるかどうかを調べ
るため、擬声語辞書１４０の参照すなわち検索を行う
（図２９のＳ１４７）。この検索も、この辞書１４０に
対して、表記マッチング法により行う。この場合、この
構成例では、この検索を、適用判定部５７０の条件判定
部５７２を介して行う。この場合の「波形ファイル名」
の読出しには、この条件判定部５７２は何ら影響を与え
ない。

【０２０９】選択された単語が擬声語辞書１４０に登録
されている場合には、この辞書１４０から波形ファイル
名を読出して、この単語表記と一緒に第１メモリ１６０
に一旦格納する（図２９のＳ１４８およびＳ１５０）。

【０２１０】一方、選択された単語が、擬声語辞書１４
０に登録されていない非登録単語である場合には、発音
辞書１０６からこの非登録単語に対応する読みとアクセ
ントとを読出し来て、第１メモリ１６０に一旦格納する
（図２９のＳ１４９およびＳ１５０）。

【０２１１】次に、選択した単語の長さだけテキストポ
インタｐを進めて、テキストポインタｐが入力テキスト
の文末に来るまで、上述した解析を繰り返し行って、入
力テキストの文頭から文末までを単語すなわち用語に分
割する（図２９のＳ１５１）。

【０２１２】テキストの終端まで解析処理が終えていな
い場合には、ステップＳ１４３に戻り、終了している場
合には、第１メモリ１６０から各単語の読みとアクセン
トを読出して入力テキストを単語毎に区切られた単語列
にする。この場合、「猫がニャーと鳴いた」は、「猫｜
が｜ニャー｜と｜鳴い｜た」という単語に区切られる。

【０２１３】この構成例の場合には、テキスト「猫が
‘ニャー’と鳴いた」は、文末まで処理した結果、「猫
（ネ’コ）」、「が（ガ）」、「‘」、「ニャー（ニ
ャ’ー）」、「’」、「と（ト）」、「鳴い（ナイ）」
及び「た（夕）」という各単語に分割される。括弧（）
内に示したのは、その単語の辞書登録情報、すなわち、
読みとアクセントである。

【０２１４】次に、テキスト解析部１０２は、この単語
列を擬声語辞書の適用判定部５７０の条件判定部５７２
に伝える。この条件判定部５７２は、擬声語辞書１４０
を参照しながらこの単語列中の単語が擬声語辞書１４０
に登録されていないかどうかを調べる。すると、「ニャ
ー（“ＣＡＴ．ＷＡＶ”）」が登録されているので、条
件判定部５７２は、ル−ル辞書５７４を参照しながらこ
の擬声語の適用判定処理を行なう（図２９のＳ１５
２）。ル−ル辞書５７４には表６において例示したよう
な適用判定条件が定められている。この構成例の場合に
は、擬声語「ニャー」は単語列中において引用符「‘」
「’」に囲まれており、従って、この擬声語は、「引用
符‘’に囲まれている」という適用判定ルールを満たす
ので、条件判定部５７２は擬声語「ニャー（“ＣＡＴ．
ＷＡＶ”）」の適用許可をテキスト解析部１０２に知ら
せる。

【０２１５】それを受け、テキスト解析部１０２は単語
列中の単語「ニャー（ニャ’ー）」を擬声語辞書１４０
の単語「ニャー（“ＣＡＴ．ＷＡＶ”）」に置き換え、
「猫（ネ’コ）」「が（ガ）」「ニャー（“ＣＡＴ．Ｗ
ＡＶ”）」「と（ト）」「鳴い（ナイ）」「た（夕）」
という単語列に変更する（図２９のＳ１５３）。なお、
引用符「‘」「’」は読みの情報を持たないので、この
時点で単語列から削除される。

【０２１６】テキスト解析部１０２は、この単語列の各
単語の辞書登録情報、すなわち、括弧（）内の情報を用
いて「ネ’コガ，”ＣＡＴ．ＷＡＶ”ト，ナイタ」とい
う音韻・韻律記号列を生成し、それを一旦第１メモリ１
６０に格納する（図２９のＳ１５４及びＳ１５５）。

【０２１７】一方、入力テキストが「犬がワンワン吠え
た」である場合を考える。テキスト解析部１０２は、発
音辞書１０６を参照し、最長一致法により、すなわち、
表記が入力テキストと一致する最長の単語を用いて、入
力テキストを単語に分割する。こうして、入力テキスト
は「犬（イヌ’）」「が（ガ）」「ワンワン（ワ’ンワ
ン）」「吠え（ホ’エ）」「た（タ）」という単語列に
分割される（Ｓ１４０〜Ｓ１５１）。

【０２１８】テキスト解析部１０２は、この単語列を適
用判定部５７０の条件判定部５７２に伝える。この条件
判定部５７２では、擬声語辞書１４０を参照してこの単
語列中の単語が擬声語辞書１４０に登録されていないか
どうかを調べる。すると、「ワンワン（“ＤＯＧ．ＷＡ
Ｖ”）」が登録されているので、この擬声語の適用判定
処理を行なう（図２９のＳ１５２）。擬声語「ワンワ
ン」は単語列中において引用符「‘」「’」で囲まれて
いないし、又、「♪」などの特定記号が付けられていな
いので、ル−ル辞書５７４の適用判定条件をどれも満た
さない。従って、条件判定部５７２は、擬声語「ワンワ
ン（“ＤＯＧ．ＷＡＶ”）」の適用不許可をテキスト解
析部１０２に知らせる。

【０２１９】これにより、テキスト解析部１０２は、単
語列「犬（イヌ’）」「が（ガ）」「ワンワン（ワ’ン
ワン）」「吠え（ホ’エ）」「た（夕）」を変更するこ
となく、この単語列の各単語の辞書登録情報、すなわ
ち、括弧（）内の情報を用いて「イヌ’ガ，ワ’ンワ
ン，ホ’エタ」という音韻・韻律記号列を生成し、それ
を第１メモリ１６０に一旦格納する（図２９のＳ１５４
及びＳ１５５）。

【０２２０】このようにして、格納された音韻・韻律記
号列を第１メモリ１６０から読出して音声規則合成部１
０４に送る。

【０２２１】音声規則合成部１０４以降の処理は、図６
及び図７を参照して説明した第１の実施の形態の構成例
の場合と同様に処理されて入力テキスト全体の波形がス
ピーカ１３０に出力されるので、その詳細な説明は省略
する。

【０２２２】尚、擬声語辞書１４０に登録された擬声語
が単語列中に複数個含まれている場合は、適用判定部５
７２はその全ての擬声語に対してルール辞書５７４の適
用判定条件に従って判定を行ない、どの擬声語が判定条
件を満たすかをテキスト解析部１０２に伝える。したが
って、条件を満たした擬声語に対してのみ、対応する波
形ファイル名が音韻・韻律記号列に埋め込まれることに
なる。

【０２２３】また、擬声語辞書１４０に登録された擬声
語が単語列中に１つも含まれていない場合は、適用判定
はせず、単語列から生成された音韻・韻律記号列がその
まま音声規則合成部１０４に送られる。

【０２２４】（５−３）効果この発明の装置５００を用いることにより得られる効果
は、基本的に第１の実施の形態の構成例の場合の効果と
同じである。しかし、この装置５００は、実際に録音さ
れた音声波形で入力テキスト中の擬声語部分を出力する
という処理を常に行なう構成とはなっていない。この装
置５００は、ある条件を満たしたときにだけ擬声語の部
分を実録音声波形で出力するという場合に使用して好適
である。一方、この処理を常に行なうという場合に第１
の実施の形態の構成例が適している。

【０２２５】（６）第６の実施の形態（６−１）構成図３０は、この発明による日本語テキスト音声変換装置
の第６の実施の形態の構成例を示すブロック図である。
この装置６００の構成上の特徴は、図２を参照して説明
した第１の実施の形態の構成例に制御部６１０を具えて
いる点である。この装置６００は、この制御部６１０に
よって通常モードと編集モードという２つの動作モード
で動作が可能である。

【０２２６】この装置６００が通常モードで動作してい
る時、制御部６１０は、テキスト解析部１０２のみと結
合され、その結果、制御部６１０は、擬声語辞書１４０
と波形辞書１５０とはデータのやりとりを行なわない。

【０２２７】一方、この装置６００が編集モードで動作
している時、制御部６１０は擬声語辞書１４０と波形辞
書１５０に結合され、その結果、制御部６１０は、テキ
スト解析部１０２とはデータのやりとりを行なわない。

【０２２８】すなわち、通常モードにおいてこの装置６
００は第１の実施の形態の構成例と同じ動作を行ない、
一方、編集モードにおいて擬声語辞書１４０と波形辞書
１５０の編集を行なうことができる。このような動作モ
ードの指定は、外部から入力部１２０を経て制御部６１
０に入力データとして動作モード指定コマンドを送るこ
とで行なわれる。

【０２２９】この第６の実施の形態の構成例において、
第１の実施の形態の構成例の構成要素と同一の構成要素
については、特に説明の必要がある場合を除き、その詳
細な説明を省略する。

【０２３０】（６−２）動作次に、図３０〜図３２を参照して、この日本語テキスト
音声変換装置６００の動作を以下に説明する。尚、図３
１及び図３２は、第６の実施の形態の構成例に含まれて
いる制御部の動作フロ−を示す図である。

【０２３１】まず、外部からの指令に基づいて、この装
置６００が編集モードで動作している場合について説明
する。

【０２３２】例えば、この装置６００の使用者が、アヒ
ルの鳴き声を録音した波形ファイル“ＤＵＣＫ．ＷＡ
Ｖ”を「ガアガア」という擬声語として擬声語辞書１４
０に登録する場合につき説明する。入力情報として、登
録コマンドに続いてテキスト「ガアガア」と波形ファイ
ル”ＤＵＣＫ．ＷＡＶ”を、外部から入力部１２０を経
て制御部６１０に入力する。制御部６１０では、外部入
力があるかどうかの判断を行い、入力情報があると、制
御部は、この入力情報を受け取って、内部のメモリに一
旦格納する（図３１のＳ１６０及びＳ１６１）。

【０２３３】入力情報が登録コマンドであると（図３１
のＳ１６２）、外部入力情報にテキスト、当該テキスト
に対応する波形ファイル名及び当該波形ファイル名に対
応する波形デ−タが含まれているかどうかの判断を行う
（図３１のＳ１６３）。

【０２３４】次に、制御部６１０は、入力情報のうち、
表記が「ガアガア」で波形ファイル名が“ＤＵＣＫ．Ｗ
ＡＶ”である擬声語の情報が、既に擬声語辞書１４０に
登録済みであるかどうか問い合わせをする（図３２のＳ
１６４）。続いて、制御部６１０は、入力情報のうち、
波形デ−タが既に波形辞書１５０に格納済みであるかど
うかを問い合わせする（図３２のＳ１６４）。

【０２３５】これらの問い合わせの結果、入力情報が擬
声語辞書１４０に既に登録済みである場合には、表記が
「ガアガア」で波形ファイル名が“ＤＵＣＫ．ＷＡＶ”
である擬声語の情報を更新する（図３２のＳ１６５）。
同様に、入力情報の波形デ−タが波形辞書１５０に既に
格納済みである場合には、当該波形ファイル名”ＤＵＣ
Ｋ．ＷＡＶ”に対応する波形デ−タを更新する（図３２
のＳ１６５）。

【０２３６】いずれの辞書１４０及び１５０に、それぞ
れに登録或いは格納されるべきこれらの入力情報が登録
或いは格納されていない場合には、表記「ガアガア」お
よび波形ファイル名”ＤＵＣＫ．ＷＡＶ”を擬声語辞書
１４０に新規登録する（図３２のＳ１６６）。さらに、
当該ファイル名に対応する実録音で得られた波形デ−タ
を波形辞書１５０に新規格納する（図３２のＳ１６
６）。

【０２３７】一方、例えば、この装置６００の使用者
が、「ニャー」という擬声語を擬声語辞書１４０から削
除する場合は、上述の処理ステップＳ１６０〜Ｓ１６１
を経て、削除コマンドに続いてテキスト「ニャー」の入
力情報をそれぞれ制御部６１０に入力する場合がある。

【０２３８】そのような場合に対応して、制御部６１０
は、登録コマンドでない場合、或いは、入力情報にテキ
スト、波形ファイル名及び波形デ−タの情報が含まれて
いなかった場合には、さらに、入力情報に削除コマンド
が含まれているかどうか判断する（図３１のＳ１６２〜
Ｓ１６３及び図３２のＳ１６７）。

【０２３９】削除コマンドが含まれている場合には、各
辞書１４０及び１５０に、削除の対象となっている情報
が既に登録・格納されているかどうか各辞書に問い合わ
せする（図３２のＳ１６８）。これらの処理において、
削除コマンドも含まれておらず、又、削除対象情報が登
録・格納されていない場合には、ステップＳ１６０に戻
る。これらの処理において、削除コマンドも含まれてお
り、かつ、削除対象情報が登録・格納されている場合に
は、それらの情報すなわちテキストの表記、波形ファイ
ル名及び波形デ−タの情報を削除する（図３２のＳ１６
９）。

【０２４０】すなわち、表記が「ニャー」で波形ファイ
ル名が”ＣＡＴ．ＷＡＶ”である擬声語が擬声語辞書１
４０に登録されているのを確認した後、この擬声語を擬
声語辞書１４０から削除する。そして、波形フアイル”
ＣＡＴ．ＷＡＶ”も波形辞書１５０から削除する。削除
コマンドに続いて入力された擬声語がもともと擬声語辞
書１４０に登録されていない場合は何もせずに処理を終
える。

【０２４１】このように、編集モードでは擬声語辞書１
４０と波形辞書１５０の編集を行なうことができる。

【０２４２】尚、通常モードでは、制御部６１０が入力
テキストを受け取り、それをテキスト解析部１０２に送
る。それ以降の処理は第１の実施の形態の構成例と同様
に行われるので、その説明は省略する。

【０２４３】最終的に入力テキスト全体の合成音声波形
が変換処理部１１０からスピーカ１３０に出力されて当
該スピ−カから合成音声として出力される。

【０２４４】（６−３）効果この発明の装置６００を用いることにより得られる効果
は、基本的に第１の実施の形態の構成例の効果と同じで
あるが、実際に録音した音で出力する凝声語を擬声語辞
書に追加したり削除したりする場合に、この第６の実施
の形態の構成例が適している。すなわち、この実施の形
態では、フレ−ズ辞書とそれに対応する波形デ−タを変
更することが出来る。一方、追加したり削除したりしな
い場合は第１の実施の形態の構成例が適している。

【０２４５】（７）変形又は変更例この発明は、上述した各実施の形態の構成例に限定され
るものではなく、多くの変形又は変更が可能である。以
下、この発明の利用形態として説明する。

【０２４６】［Ａ］第２の実施の形態の構成例におい
て、背景音の波形が入力テキストの波形より長い場合
は、前者を後者の長さで打ち切ってから重畳させる代わ
りに、前者の音量が後者の長さの位置で０になるように
前者の音量を徐々に減衰させてから重畳させることもで
きる。あるいは、前者と後者を重畳させて前者が後者よ
りはみでる部分の波形、すなわち、後者の長さの位置以
降の前者の波形を、次の入力テキストの波形に重畳させ
る、すなわち、複数の入力テキストにまたがって背景音
を出力させることもできる。

【０２４７】［Ｂ］第４の実施の形態の構成例におい
て、楽音の波形が入力テキストの波形より長い場合は、
前者の音量が後者の長さの位置で０になるように前者の
音量を徐々に減衰させてから重畳させることもできる。
あるいは、前者と後者を足し合わせて前者が後者よりは
みでる部分の波形、すなわち、後者の長さの位置以降の
前者の波形を、次の入力テキストの波形に重畳させる、
すなわち、複数の入力テキストにまたがって楽音を出力
させることもできる。

【０２４８】［Ｃ］第５の実施の形態の構成例におい
て、凝声語辞書１４０に各単語の登録情報として「主
語」という属性情報を追加し、ルール辞書５７４の適用
判定条件として「主語が一致する」という条件を設け
て、擬声語辞書１４０を適用させることもできる。例え
ば、擬声語辞書１４０に「表記：ガオー、波形ファイ
ル：“ＬＩＯＮ．ＷＡＶ”、主語：ライオン」という擬
声語と「表記：ガオー、波形ファイル：“ＢＥＡＲ．Ｗ
ＡＶ”、主語：熊」という擬声語が登録されているとす
ると、入力テキストが「熊がガオーと吠えた」である場
合、入力テキストの主語が「熊」であるので「主語が一
致する」という条件を満たす後者すなわち熊の擬声語
「ガオー」の方を適用し、同条件を満たさない前者すな
わちライオンの擬声語「ガオー」の方は適用しないとい
う適用判定条件を条件判定部５７２に行なわせることも
できる。すなわち、テキスト文の主語に応じて、波形デ
−タを使い分けすることが出来る。

【０２４９】［Ｄ］第５の実施の形態の構成例は、第１
の実施の形態の構成例を基にしているが、同じように第
２の実施の形態の構成例を基にすることもできる。すな
わち、第２の実施の形態の構成例の構成に背景音辞書適
用の条件判定部と適用判定条件を格納したル−ル辞書を
追加し、適用判定条件を満たした時にだけ背景音辞書２
４０を適用させることもできる。従って、フレ−ズ辞書
に対応した波形デ−タを常に用いるのではなく、ある適
用判定条件を満たしている場合に限り、波形デ−タを用
いることが出来る。

【０２５０】［Ｅ］第５の実施の形態の構成例は、第１
の実施の形態の構成例を基にしているが、同じように第
３の実施の形態の構成例を基にすることもできる。すな
わち、第３の実施の形態の構成例の構成に歌唱フレーズ
辞書適用の条件判定部と適用判定条件を格納したルール
辞書を追加し、適用判定条件を満たした時にだけ歌唱フ
レーズ辞書３４０を適用させることもできる。従って、
歌唱フレ−ズ辞書に対応した歌声の合成音声波形を常に
用いるのではなく、ある判定条件を満たしている場合に
限り、歌声の合成音声波形を用いることが出来る。

【０２５１】［Ｆ］第５の実施の形態の構成例は、第１
の実施の形態の構成例を基にしているが、同じように第
４の実施の形態の構成例を基にすることもできる。すな
わち、第４の実施の形態の構成に曲名辞書適用の条件判
定部と適用判定条件を格納したルール辞書を追加し、適
用判定条件を満たした時にだけ曲名辞書４４０を適用さ
せることもできる。従って、曲名辞書に対応した楽曲演
奏波形を常に用いるのではなく、ある判定条件を満たし
ている場合に限り、楽曲演奏波形を用いることが出来
る。

【０２５２】［Ｇ］第６の実施の形態の構成例は、第１
の実施の形態の構成例を基にしているが、同じように第
２の実施の形態の構成例を基にすることもできる。すな
わち、第２の実施の形態の構成に制御部を追加し、通常
モードでは第２の実施の形態の構成例と同じ動作をさ
せ、一方、編集モードでは背景音辞書２４０と波形辞書
２５０の編集を行なわせることもできる。

【０２５３】［Ｈ］第６の実施の形態の構成例は、第１
の実施の形態の構成例を基にしているが、同じように第
３の実施の形態の構成例を基にすることもできる。すな
わち、第３の実施の形態の構成に制御部を追加し、通常
モードでは第３の実施の形態の構成例と同じ動作をさ
せ、一方、編集モードでは歌唱フレーズ辞書３４０の編
集を行なわせることもできる。従って、この場合には、
歌唱フレ−ズ辞書の登録内容を変更することが出来る。

【０２５４】［Ｉ］第６の実施の形態の構成例は、第１
の実施の形態の構成例を基にしているが、同じように第
４の実施の形態の構成例を基にすることもできる。すな
わち、第４の実施の形態の構成に制御部を追加し、通常
モードでは第４の実施の形態の構成例と同じ動作をさ
せ、一方、編集モードでは曲名辞書４４０と楽曲データ
を格納した楽曲辞書４５４の編集を行なわせることもで
きる。この場合には、曲名辞書と楽曲辞書の登録内容を
変更することが出来る。

【０２５５】［Ｊ］第６の実施の形態の構成例は、第１
の実施の形態の構成例を基にしているが、同じように第
５の実施の形態の構成例を基にすることもできる。すな
わち、第５の実施の形態の構成に制御部を追加し、通常
モードでは第５の実施の形態の構成例と同じ動作をさ
せ、一方、編集モードでは擬声語辞書１４０と波形辞書
１５０と適用判定条件が格納されたルール辞書５７４の
編集を行なわせることもできる。このようにすれば、波
形デ−タを用いる判定条件を変更することが出来る。

【０２５６】［Ｋ〕第１から第６までの実施の形態の構
成例は、幾つか互いに組み合わせて使用することもでき
る。

【０２５７】

【発明の効果】上述した説明からも明らかなように、こ
の発明によれば、下記のような効果を奏し得る。

【０２５８】すなわち、この発明の日本語テキスト音声
変換装置によれば、聞く人が聞き飽きたり疲れたりしな
い合成音声を出力することが出来る。

【０２５９】この発明の他の日本語テキスト音声変換装
置によれば、テキストの用語中から選ばれた音関連用語
の合成音声波形を、実録音声波形で置き換えて、全体の
合成音声を出力することが出来る。

【０２６０】この発明のさらに他の日本語テキスト音声
変換装置によれば、テキスト用語の全体の合成音声波形
と、テキストの用語中から選ばれた音関連用語に関連す
る実録音声波形とを、双方同時に出力させて、合成音声
を出力することが出来る。

【図面の簡単な説明】

【図１】従来の日本語テキスト音声変換装置を示すブロ
ック図である。

【図２】この発明による日本語テキスト音声変換装置の
第１の実施の形態の構成例を示すブロック図である。

【図３】第１の実施の形態の構成例において、合成音声
波形と、擬声語の実録音声波形とを結合する例を説明す
るための説明図である。

【図４】第１の実施の形態の構成例の動作の説明に供す
るテキスト解析部の動作フロ−図である。

【図５】図４に続くテキスト解析部の動作フロ−図であ
る。

【図６】第１及び第５の実施の形態の構成例の動作の説
明に供する音声規則合成部の動作フロ−図である。

【図７】図６に続く音声規則合成部の動作フロ−図であ
る。

【図８】この発明による日本語テキスト音声変換装置の
第２の実施の形態の構成例を示すブロック図である。

【図９】第２の実施の形態の構成例において、合成音声
波形と、背景音の実録音声波形とを重畳する例を説明す
るための説明図である。

【図１０】第２の実施の形態の構成例の動作の説明に供
するテキスト解析部の動作フロ−図である。

【図１１】図１０に続くテキスト解析部の動作フロ−図
である。

【図１２】第２の実施の形態の構成例の動作の説明に供
する音声規則合成部の動作フロ−図である。

【図１３】図１２に続く音声規則合成部の動作フロ−図
である。

【図１４】図１３に続く音声規則合成部の動作フロ−図
である。

【図１５】この発明による日本語テキスト音声変換装置
の第３の実施の形態の構成例を示すブロック図である。

【図１６】第３の実施の形態の構成例において、合成音
声波形と、歌声の合成音声波形とを結合する例を説明す
るための説明図である。

【図１７】第３の実施の形態の構成例の動作の説明に供
するテキスト解析部の動作フロ−図である。

【図１８】図１７に続くテキスト解析部の動作フロ−図
である。

【図１９】第３の実施の形態の構成例の動作の説明に供
する音声規則合成部の動作フロ−図である。

【図２０】この発明による日本語テキスト音声変換装置
の第４の実施の形態の構成例を示すブロック図である。

【図２１】第４の実施の形態の構成例において、合成音
声波形と、楽音波形とを重畳する例を説明するための説
明図である。

【図２２】第４の実施の形態の構成例の動作の説明に供
するテキスト解析部の動作フロ−図である。

【図２３】図２２に続くテキスト解析部の動作フロ−図
である。

【図２４】第４の実施の形態の構成例の動作の説明に供
する音声規則合成部の動作フロ−図である。

【図２５】図２４に続く音声規則合成部の動作フロ−図
である。

【図２６】図２５に続く音声規則合成部の動作フロ−図
である。

【図２７】この発明による日本語テキスト音声変換装置
の第５の実施の形態の構成例を示すブロック図である。

【図２８】第５の実施の形態の構成例の動作の説明に供
するテキスト解析部の動作フロ−図である。

【図２９】図２８に続くテキスト解析部の動作フロ−図
である。

【図３０】この発明による日本語テキスト音声変換装置
の第６の実施の形態の構成例を示すブロック図である。

【図３１】第６の実施の形態の構成例の動作の説明に供
する制御部の動作フロ−図である。

【図３２】図３１に続く制御部の動作フロ−図である。

【符号の説明】

１００，２００，３００，４００，５００，６００：日
本語テキスト音声変換装置１０２，２０２，３０２，４０２：テキスト解析部１０４，２０４，３０４，４０４：音声規則合成部１０６，２０６，３０６，４０６：発音辞書１０８，２０８，３０８，４０８：音声波形メモリ１１０，２１０，３１０，４１０：変換処理部１２０，２２０，３２０，４２０：入力部１３０，２３０，３３０，４３０：スピ−カ１４０，２４０，３４０：フレ−ズ辞書１５０，２５０：波形辞書１６０，２６０，３６０，４６０：第１メモリ３５０：歌唱用音韻・韻律記号列処理部４４０：曲名辞書４５０：楽音波形生成部４５２：楽音波形変換部列処理部４５４：楽曲辞書５７０：適用判定部５７２：条件判定部５７４：ル−ル辞書６１０：制御部

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｇ１０Ｌ 5/04 Ｆ

Claims

【特許請求の範囲】

【請求項１】テキストを音声波形に変換して出力する
テキスト音声変換装置において、外部から入力されたテキストを音声波形に変換する変換
処理部と、実録音の再生音として表現されるべき音関連用語が予め
登録されているフレ−ズ辞書と、実録音で得た、該音関連用語に対応する波形デ−タが予
め登録されている波形辞書とを具え、前記変換処理部は、前記テキスト中の用語と前記フレ−
ズ辞書に登録されている前記音関連用語との照合が一致
した用語に対しては、前記波形辞書に登録されている、
当該一致した音関連用語に対応する波形デ−タを音声波
形として出力する機能を有していることを特徴とするテ
キスト音声変換装置。
【請求項２】請求項１に記載のテキスト音声変換装置
において、前記テキスト中の用語が、前記フレ−ズ辞書に対する前
記照合のための適用条件を満たすか否かを判定し、該適
用条件を満たしている当該用語と一致する音関連用語の
みを前記フレ−ズ辞書から前記変換処理部に読出す適用
判定部を具えることを特徴とするテキスト音声変換装
置。
【請求項３】請求項１に記載のテキスト音声変換装置
において、前記フレ−ズ辞書に登録されている音関連用語及び前記
波形辞書に登録されている波形デ−タのそれぞれの登録
内容を編集する制御部を具えていることを特徴とするテ
キスト音声変換装置。
【請求項４】請求項１に記載のテキスト音声変換装置
において、前記フレ−ズ辞書を、擬声語が登録された擬声語辞書と
することを特徴とするテキスト音声変換装置。
【請求項５】請求項２に記載のテキスト音声変換装置
において、前記適用条件は、前記テキスト中の用語が引用符で囲ま
れていること、としたことを特徴とするテキスト音声変換装置。
【請求項６】請求項２に記載のテキスト音声変換装置
において、前記適用条件は、前記テキスト中の用語の前および後の
双方またはいずれか一方に特定記号が存在すること、と
したことを特徴とするテキスト音声変換装置。
【請求項７】請求項２に記載のテキスト音声変換装置
において、前記フレ−ズ辞書に前記音関連用語がその主語情報と共
に登録されている場合には、前記適用条件は、当該主語
情報が前記テキストの文法的な主語と一致すること、と
したことを特徴とするテキスト音声変換装置。
【請求項８】請求項２に記載のテキスト音声変換装置
において、前記適用条件を変更出来る適用条件変更手段を具えるこ
とを特徴とするテキスト音声変換装置。
【請求項９】テキストを音声波形に変換して出力する
テキスト音声変換装置において、外部から入力されたテキストを音声波形に変換する変換
処理部と、実録音の再生音として表現されるべき音関連用語が予め
登録されているフレ−ズ辞書と、実録音で得た、該音関連用語に対応する波形デ−タが予
め登録されている波形辞書とを具え、前記変換処理部は、前記テキスト中の用語と前記フレ−
ズ辞書に登録されている前記音関連用語との照合が一致
した場合には、前記波形辞書に登録されている、当該一
致した音関連用語に対応する波形デ−タを、前記テキス
トの音声波形と重畳させて出力する機能を具えることを
特徴とするテキスト音声変換装置。
【請求項１０】請求項９に記載のテキスト音声変換装
置において、前記テキスト中の用語が、前記フレ−ズ辞書に対する前
記照合のための適用条件を満たすか否かを判定し、該適
用条件を満たしている当該用語と一致する音関連用語の
みを前記フレ−ズ辞書から前記変換処理部に読出す適用
判定部を具えることを特徴とするテキスト音声変換装
置。
【請求項１１】請求項９に記載のテキスト音声変換装
置において、前記変換処理部は、前記波形辞書から読出された前記波
形デ−タの時間的長さを調節する時間長の調節機能を具
えていることを特徴とするテキスト音声変換装置。
【請求項１２】請求項１１に記載のテキスト音声変換
装置において、前記時間長の調節は、前記波形デ−タが前記テキストの
音声波形より長い場合に、当該波形デ−タの長さを当該
音声波形の長さの終了位置で打ち切ることによって行う
ことを特徴とするテキスト音声変換装置。
【請求項１３】請求項１１に記載のテキスト音声変換
装置において、前記時間長の調節は、前記波形デ−タが前記テキストの
音声波形より長い場合に、当該波形デ−タの音量が当該
音声波形の長さの終了位置で零となるように、当該音量
を徐々に減衰させるという、音量調節によって行うこと
を特徴とするテキスト音声変換装置。
【請求項１４】請求項１１に記載のテキスト音声変換
装置において、前記時間長の調節は、前記波形デ−タが前記テキストの
音声波形より長い場合に、当該波形デ−タを、当該音声
波形とこれに続く次の音声波形にまたがって出力させる
ことによって行うことを特徴とするテキスト音声変換装
置。
【請求項１５】請求項１１に記載のテキスト音声変換
装置において、前記時間長の調節は、前記波形デ−タが前記テキストの
音声波形より短い場合に、当該波形デ−タを繰り返し連
続的につなぎ合わせることによって行うことを特徴とす
るテキスト音声変換装置。
【請求項１６】請求項９に記載のテキスト音声変換装
置において、前記フレ−ズ辞書に登録されている音関連用語及び前記
波形辞書に登録されている波形デ−タのそれぞれの登録
内容を編集する制御部を具えていることを特徴とするテ
キスト音声変換装置。
【請求項１７】請求項９に記載のテキスト音声変換装
置において、前記フレ−ズ辞書を、背景音が登録された背景音辞書と
することを特徴とするテキスト音声変換装置。
【請求項１８】請求項１０に記載のテキスト音声変換
装置において、前記適用条件は、前記テキスト中の用語が引用符で囲ま
れていること、としたことを特徴とするテキスト音声変
換装置。
【請求項１９】請求項１０に記載のテキスト音声変換
装置において、前記適用条件は、前記テキスト中の用語の前および後の
双方またはいずれか一方に特定記号が存在すること、と
したことを特徴とするテキスト音声変換装置。
【請求項２０】請求項１０に記載のテキスト音声変換
装置において、前記フレ−ズ辞書に前記音関連用語がその主語情報と共
に登録されている場合には、前記適用条件は、当該主語
情報が前記テキストの文法的な主語と一致すること、と
したことを特徴とするテキスト音声変換装置。
【請求項２１】請求項１０に記載のテキスト音声変換
装置において、前記適用条件を変更出来る適用条件変更手段を具えるこ
とを特徴とするテキスト音声変換装置。
【請求項２２】テキストを音声波形に変換して出力す
るテキスト音声変換装置において、外部から入力され、かつ歌詞を含むテキストを音声波形
に変換する変換処理部と、歌詞と該歌詞に対応する歌唱用音韻・韻律記号列とが対
となって予め登録されている歌唱フレ−ズ辞書と、前記音韻・韻律列記号列を歌声の音声波形に変換するた
めに、当該音韻・韻律記号列を解析する音韻・韻律記号
列処理部とを具え、前記変換処理部は、前記テキスト中の歌詞と前記歌唱フ
レ−ズ辞書に登録されている登録歌詞との照合が一致し
た歌詞に対しては、前記歌唱フレ−ズ辞書に登録されて
いる、当該一致した登録歌詞と対となっている前記音韻
・韻律記号列に基づいて変換された歌声の音声波形を、
前記歌詞の音声波形として出力させる機能を具えること
を特徴とするテキスト音声変換装置。
【請求項２３】請求項２２に記載のテキスト音声変換
装置において、前記テキスト中の歌詞が、前記歌唱フレ−ズ辞書に対す
る前記照合のための適用条件を満たすか否かを判定し、
該適用条件を満たしている当該歌詞と一致する前記登録
歌詞と該登録歌詞と対となっている前記音韻・韻律記号
列とを前記歌唱フレ−ズ辞書から前記変換処理部に読出
す適用判定部を具えることを特徴とするテキスト音声変
換装置。
【請求項２４】請求項２２に記載のテキスト音声変換
装置において、前記登録歌詞及び該登録歌詞と対となっている音韻・韻
律記号列のそれぞれの登録内容を編集する制御部を具え
ていることを特徴とするテキスト音声変換装置。
【請求項２５】請求項２３に記載のテキスト音声変換
装置において、前記適用条件は、前記テキスト中の歌詞が引用符で囲ま
れていること、としたことを特徴とするテキスト音声変
換装置。
【請求項２６】請求項２３に記載のテキスト音声変換
装置において、前記適用条件は、前記テキスト中の歌詞の前および後の
双方またはいずれか一方に特定記号が存在すること、と
したことを特徴とするテキスト音声変換装置。
【請求項２７】請求項２３に記載のテキスト音声変換
装置において、前記適用条件を変更出来る適用条件変更手段を具えるこ
とを特徴とするテキスト音声変換装置。
【請求項２８】テキストを音声波形に変換して出力す
るテキスト音声変換装置において、外部から入力され、かつ曲名を含むテキストを音声波形
に変換する変換処理部と、曲名が予め登録されている曲名辞書と、当該曲名に対応した楽音波形を生成する楽音波形生成部
とを具え、該楽音波形生成部は、前記曲名辞書に登録された曲名に
対応する演奏用デ−タが予め登録されている楽曲辞書
と、該演奏用デ−タを楽曲の楽音波形に変換する楽音波
形変換部とを含み、前記変換処理部は、前記テキスト中の曲名と前記曲名辞
書に登録されている登録曲名との照合が一致した曲名に
対しては、前記登録曲名に対応する前記楽曲のの楽音波
形を、前記テキストの音声波形に重畳させて、出力する
機能を具えることを特徴とするテキスト音声変換装置。
【請求項２９】請求項２８に記載のテキスト音声変換
装置において、前記テキスト中の曲名が、前記曲名辞書に対する前記照
合のための適用条件を満たすか否かを判定し、該適用条
件を満たしている当該曲名と一致する登録曲名のみを前
記曲名辞書から前記変換処理部に読出す適用判定部を具
えることを特徴とするテキスト音声変換装置。
【請求項３０】請求項２８に記載のテキスト音声変換
装置において、前記変換処理部は、前記楽音波形生成部から読出された
前記楽音波形の時間的長さを調節する時間長の調節機能
を具えていることを特徴とするテキスト音声変換装置。
【請求項３１】請求項３０に記載のテキスト音声変換
装置において、前記時間長の調節は、前記楽音波形が前記テキストの音
声波形より長い場合に、当該楽音波形の音量が当該テキ
ストの音声波形の長さの終了位置で零となるように、当
該音量を徐々に減衰させるという、音量調整によって行
うことを特徴とするテキスト音声変換装置。
【請求項３２】請求項３０に記載のテキスト音声変換
装置において、前記時間長の調節は、前記楽音波形が前記テキストの音
声波形より長い場合に、当該楽音波形を、当該テキスト
の音声波形とこれに続く次の音声波形とにまたがって、
出力させることによって行うことを特徴とするテキスト
音声変換装置。
【請求項３３】請求項２８に記載のテキスト音声変換
装置において、前記曲名辞書に登録されている登録曲名及び前記楽曲辞
書に登録されている演奏用デ−タのそれぞれの登録内容
を編集する制御部を具えていることを特徴とするテキス
ト音声変換装置。
【請求項３４】請求項２９に記載のテキスト音声変換
装置において、前記適用条件は、前記テキスト中の曲名が引用符で囲ま
れていること、としたことを特徴とするテキスト音声変
換装置。
【請求項３５】請求項２９に記載のテキスト音声変換
装置において、前記適用条件は、前記テキスト中の曲名の前および後の
双方またはいずれか一方に特定記号が存在すること、と
したことを特徴とするテキスト音声変換装置。
【請求項３６】請求項２９に記載のテキスト音声変換
装置において、前記適用条件を変更出来る適用条件変更手段を具えるこ
とを特徴とするテキスト音声変換装置。
【請求項３７】請求項１に記載のテキスト音声変換装
置において、前記フレ−ズ辞書に登録されている前記音関連用語は、
当該音関連用語の表記と、該表記に対応する波形ファイ
ル名とを含み、および前記波形辞書に登録されている波
形デ−タは、実録音による原音デ−タであって、これら
波形デ−タは、波形ファイルとして格納されていること
を特徴とするテキスト音声変換装置。
【請求項３８】請求項１に記載のテキスト音声変換装
置において、前記フレ−ズ辞書に登録されている前記音関連用語は、
当該音関連用語の表記と、該表記に対応する波形ファイ
ル名とを含み、および前記波形辞書に登録されている波
形デ−タは、実録音による原音デ−タであって、これら
波形デ−タは、波形ファイルとして格納されており、前記変換処理部は、前記テキストが入力される入力部と、単語の読みとアクセントが登録されている発音辞書と、前記入力部、前記発音辞書及び前記フレ−ズ辞書に結合
されていて、前記入力部から入力されたテキストの用語
のうち、前記発音辞書およびフレ−ズ辞書の双方に登録
されている用語に対しては、前記フレ−ズ辞書に登録さ
れている音関連用語の波形ファイル名を用い、およびそ
の他の用語については前記発音辞書に登録されている読
みとアクセントとを用いて、前記テキストの音韻・韻律
記号列を生成するテキスト解析部と、音声素片デ−タが格納されている音声波形メモリと、該音声波形メモリ、前記波形辞書および前記テキスト解
析部に結合されていて、前記音韻・韻律記号列の中の前
記波形ファイル名を除いた各記号を前記音声素片デ−タ
を用いて音声波形に変換すると共に、前記波形ファイル
名に対応する波形デ−タを前記波形辞書から読出して来
て、前記音声波形と前記波形デ−タとの合成波形を出力
する音声規則合成部とを含むことを特徴とするテキスト
音声変換装置。
【請求項３９】請求項９又は１０に記載のテキスト音
声変換装置において、前記フレ−ズ辞書に登録されている前記音関連用語は、
当該音関連用語の表記と、該表記に対応する波形ファイ
ル名とを含み、および前記波形辞書に登録されている波
形デ−タは、実録音による原音デ−タであって、これら
波形デ−タは、波形ファイルとして格納されていること
を特徴とするテキスト音声変換装置。
【請求項４０】請求項９又は１０に記載のテキスト音
声変換装置において、前記フレ−ズ辞書に登録されている前記音関連用語は、
当該音関連用語の表記と、該表記に対応する波形ファイ
ル名とを含み、および前記波形辞書に登録されている波
形デ−タは、実録音による原音デ−タであって、これら
波形デ−タは、波形ファイルとして格納されており、前記変換処理部は、前記テキストが入力される入力部と、単語の読みとアクセントが登録されている発音辞書と、前記入力部、前記発音辞書及び前記フレ−ズ辞書に結合
されていて、前記入力部から入力されたテキストの用語
のうち、前記フレ−ズ辞書に登録されている用語に対し
ては、前記音関連用語の波形ファイル名を用い、および
前記テキストの全ての用語について前記発音辞書に登録
されている読みとアクセントとを用いて、前記テキスト
の音韻・韻律記号列を生成するテキスト解析部と、音声素片デ−タが格納されている音声波形メモリと、該音声波形メモリ、前記波形辞書および前記テキスト解
析部に結合されていて、前記音韻・韻律記号列の中の各
記号を前記音声素片デ−タを用いて音声波形に変換する
と共に、前記波形ファイル名に対応する波形デ−タを前
記波形辞書から読出して来て、前記音声波形と前記波形
デ−タとを、時間的に並列の関係で、出力する音声規則
合成部とを含むことを特徴とするテキスト音声変換装
置。
【請求項４１】請求項９又は１０に記載のテキスト音
声変換装置において、前記フレ−ズ辞書は、背景音の表記とこれに対応する波
形ファイル名が登録された背景音辞書とすることを特徴
とするテキスト音声変換装置。
【請求項４２】請求項２２に記載のテキスト音声変換
装置において、前記変換処理部は、前記テキストが入力される入力部と、単語の読みとアクセントが登録されている発音辞書と、前記入力部、前記発音辞書及び前記フレ−ズ辞書に結合
されていて、前記入力部から入力されたテキストの用語
のうち前記歌詞に対しては、前記歌唱フレ−ズ辞書に登
録されている前記歌唱用音韻・韻律記号列を用い、およ
びその他の用語については前記発音辞書に登録されてい
る読みとアクセントとを用いて、前記テキストの音韻・
韻律記号列を生成するテキスト解析部と、音声素片デ−タが格納されている音声波形メモリと、該音声波形メモリ、前記歌唱用音韻・韻律記号列処理部
および前記テキスト解析部に結合されていて、前記音韻
・韻律記号列の中の前記歌唱用音韻・韻律記号列を除い
た各記号を前記音声素片デ−タを用いて音声波形に変換
すると共に、前記歌唱用音韻・韻律記号列処理部及び前
記音声波形メモリと協同して前記歌唱用音韻・韻律記号
列に対応する波形デ−タを前記歌唱用音韻・韻律記号列
処理部で生成して、前記音声波形と前記波形デ−タとの
合成波形を出力する音声規則合成部とを含むことを特徴
とするテキスト音声変換装置。
【請求項４３】請求項２８に記載のテキスト音声変換
装置において、前記曲名辞書に登録されている前記曲名は、当該曲名の
表記と、該表記に対応する楽曲ファイル名とを含み、お
よび前記楽曲辞書に登録されている前記演奏用デ−タ
は、実録音による原音デ−タであって、これら演奏用デ
−タは、楽曲ファイルとして格納されており、前記変換処理部は、前記テキストが入力される入力部と、単語の読みとアクセントが登録されている発音辞書と、前記入力部、前記発音辞書及び前記曲名辞書に結合され
ていて、前記入力部から入力されたテキストの用語のう
ち前記曲名に対しては、前記楽曲ファイル名を用い、お
よび前記テキストの全ての用語について前記発音辞書に
登録されている読みとアクセントとを用いて、前記テキ
ストの音韻・韻律記号列を生成するテキスト解析部と、音声素片デ−タが格納されている音声波形メモリと、該音声波形メモリ、前記楽音波形生成部および前記テキ
スト解析部に結合されていて、前記音韻・韻律記号列の
中の各記号を前記音声素片デ−タを用いて音声波形に変
換すると共に、前記楽曲ファイル名に対応する演奏用デ
−タを前記楽音波形生成部から読出して来て、前記音声
波形と前記演奏用デ−タとを、時間的に並列の関係で、
出力する音声規則合成部とを含むことを特徴とするテキ
スト音声変換装置。
【請求項４４】請求項２，１０および２３のいずれか
一項に記載のテキスト音声変換装置において、前記適用判定部は、前記変換処理部と前記フレ−ズ辞書
との間に結合されていて、前記適用条件が格納されたル
−ル辞書と、前記フレ−ズ辞書の適用の可否を判定する
条件判定部とを具えていることを特徴とするテキスト音
声変換装置。
【請求項４５】請求項２９に記載のテキスト音声変換
装置において、前記適用判定部は、前記変換処理部と前記曲名辞書との
間に結合されていて、前記適用条件が格納されたル−ル辞書と、前記曲名辞書
の適用の可否を判定する条件判定部とを具えていること
を特徴とするテキスト音声変換装置。