JP2000187495A

JP2000187495A - 音声合成法方法、装置、および音声合成プログラムを記録した記録媒体

Info

Publication number: JP2000187495A
Application number: JP10363283A
Authority: JP
Inventors: Keiko Inagaki; 敬子稲垣; Yukio Mitome; 幸夫三留
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1998-12-21
Filing date: 1998-12-21
Publication date: 2000-07-04
Anticipated expiration: 2018-12-21
Also published as: JP3576848B2

Abstract

(57)【要約】【課題】話者の個人性を考慮した発音情報を生成す
る。【解決手段】話者別単語辞書３には、各単語の見出
し、品詞、読みとアクセント位置が記憶されている。音
声情報データ6には、話者別単語辞書３を作成した話者
が発声した文や単語から抽出された韻律パターンと音声
波形が、テキスト情報と発音情報、ラベル情報とともに
記憶されている。テキスト解析部２は入力端子１から入
力された入力テキストに対して話者別単語辞書３を用い
て読みとアクセント、ポーズからなる発音情報を生成す
る。韻律情報生成部４はテキスト解析部２で生成された
発音情報に基づいて、イントネーションやリズムのパタ
ンを、音声情報データ６に記憶されている規則やパタン
から生成する。合成音声生成部５は、発音情報と韻律情
報に基づいて音声情報データ６に記憶されている音声パ
タンを用いて合成音声を生成し、出力端子７から出力す
る。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、テキストに基づい
て合成音声を生成する音声合成方法および装置に関す
る。

【０００２】

【従来の技術】従来、日本語テキストを音声に変換する
音声合成装置として様々の装置が開発されている。現在
では、より高品質な合成のために、合成音声の個人性の
向上が多く望まれている。個人性とは、合成音声が画一
的でなく、その人らしさを再現するものであり、あたか
も本人が話しているかのような合成音声を生成するため
には重要な要素である。この合成音声の個人性を向上さ
せる合成装置の従来例として特開平８―８７２９７（従
来例１）がある。

【０００３】図７は、この従来例１の音声合成装置の概
略構成を示すブロック図であり、任意の入力テキストを
合成音声に出力する場合を示している。この従来の音声
合成装置は音声情報検索部２１と音声情報データベース
２２と合成音声生成部２３と合成音声生成規則２４とか
ら構成されている。

【０００４】音声情報検索部２１は、テキストまたは発
音記号列が入力されると、自然音声を分析し、抽出した
音声特徴量およびこれに対応する発声内容を格納した音
声情報データベース２２中に、入力テキストまたは発音
記号列に一致する発声内容が存在するか否かを検索し、
一致する発声内容が存在する場合は、これを合成音声生
成部２３へ渡し、音声情報に応じた処理を施して合成音
声を生成する。また、音声情報検索部２１は一致する発
声内容が存在しない場合には、入力テキストまたは入力
表音記号列をそのまま合成音声生成部２３へ渡し、合成
音声生成部２３は合成音声生成規則２４に基づいて合成
音声を生成する。このように、音声情報データベース２
２にあらかじめ自然音声を記憶させておき、発声させた
い内容と同じものが音声情報データベース２２にある場
合には、音声合成を行わず自然音声を出力することで、
元の話者の個人性を含む合成音声を生成している。

【０００５】また、他の従来例として、特開平１０―１
５３９９８（従来例２）がある。これは、自然音声を補
助情報として使用し、規則合成により音声を合成する装
置で、単語辞書を参照して入力テキストの解析により得
た単語系列の各単語の音素系列に対する韻律情報を設定
し、音声波形辞書を参照して各単語の音素系列から音素
波形系列を求めている。また、入力自然音声から韻律情
報を抽出し、設定された韻律情報と抽出された韻律情報
のいずれかを選択し、その選択された韻律情報により音
声波形系列を制御し、合成音声を生成している。このよ
うに自然音声から抽出された韻律情報には、元の話者の
イントネーションや発声速度などの個人性が含まれてい
る。

【０００６】

【発明が解決しようとする課題】従来例１の音声合成装
置では、自然音声から抽出した音声波形をそのまま使用
することで、合成音声の個人性を向上させている。ま
た、従来例２の音声合成装置では、自然音声から抽出し
た韻律パタンをそのまま用いて、元の話者の話し方を再
現することで個人性を向上させている。しかし、従来例
１、２では、一致する文が記憶したデータにない場合に
は、規則によりそれらを生成するため、自然音声から抽
出したパタンを使った合成音声と比較すると個人性は劣
化してしまう。従来例１、２において個人性を向上させ
るためには、膨大なデータが必要であり、すべての文を
網羅するパタンを用意することは困難である。また、従
来例１、２では、入力テキストを解析し、その発音情報
を単語辞書を用いて生成するが、この単語辞書は、どの
話者データに対しても共通であるため、テキストの解析
結果も同じである。しかし、たとえ同一の文であって
も、実際には発音情報が話者により微妙に異なることは
多々ある。この違いは、従来例１や２の方法では、対処
することができない。合成音声をより一層元の話者の発
声に近づけるためには、この発音情報を生成する時にも
個人性を考慮する必要がある。

【０００７】本発明の目的は、合成音声の個人性を向上
させるために、話者の個人性を考慮した発音情報を生成
することができる音声合成方法および装置を提供するこ
とにある。

【０００８】

【課題を解決するための手段】本発明の第１の音声合成
方法は、入力テキストに対し、話者の話すとおりの読み
とアクセントを持つ話者別単語辞書を用いて音韻情報を
生成するテキスト解析段階と、入力テキストの韻律情報
を生成する韻律情報生成段階と、音韻情報と前記韻律情
報に基づいて合成音声を生成する合成音声生成段階とを
有する。

【０００９】本発明の第１の音声合成装置は、話者の話
すとおりの読みとアクセントを持つ話者別単語辞書と、
入力テキストに対して前記話者別単語辞書を用いて音韻
情報を生成するテキスト解析手段と、入力テキストの韻
律情報を生成する韻律情報生成手段と、音韻情報と韻律
情報に基づいて合成音声を生成する合成音声生成手段を
有する。

【００１０】本発明の第２の音声合成法方法は、第１の
音声合成法方法において、話者別単語辞書が話者毎に存
在し、テキスト解析段階で、入力された話者情報から話
者別単語辞書を切り替える。

【００１１】本発明の第２の音声合成装置は、話者の話
すとおりの読みとアクセントを持つ、話者毎の話者別単
語辞書と、入力された話者情報から話者別単語辞書を切
り替え、入力テキストに対して該話者別単語辞書を用い
て音韻情報を生成するテキスト解析手段と、入力テキス
トの韻律情報を生成する韻律情報生成手段と、音韻情報
と韻律情報に基づいて合成音声を生成する合成音声生成
手段を有する。

【００１２】本発明の第３の音声合成方法は、入力テキ
ストに対し、国語辞典に記述されている通常の読みを持
つ単語辞書と、その読みを話読特有の読みに変換する読
み変換手段を用いて音韻情報を生成するテキスト解析段
階と、入力テキストの韻律情報を生成する韻律情報生成
段階と、記音律情報と韻律情報に基づいて合成音声を生
成する合成音声生成段階とを有する。

【００１３】本発明の第３の音声合成装置は、国語辞典
に記述されている通常の読みを持つ単語辞書と、単語辞
書の読みを話者特有の読みに変換する読み変換手段と、
入力テキストに対して単語辞書と読み変換手段を用いて
音韻情報を生成するテキスト解析手段と、入力テキスト
の韻律情報を生成する韻律情報生成手段と、音韻情報と
韻律情報に基づいて合成音声を生成する合成音声生成手
段とを有する。

【００１４】本発明の第４の音声合成方法は、入力テキ
ストに対して、国語辞典に記述されている通常の読みを
持つ単語辞書と、その読みを話読特有の読みに変換す
る、話者毎の読み変換手段を用いて、話者毎に読み変換
手段を切り替えて音韻情報情報を生成するテキスト解析
段階と、入力テキストの韻律情報を生成する韻律情報生
成段階と、音韻情報と韻律情報に基づいて合成音声を生
成する合成音声生成段階とを有する。

【００１５】本発明の第４の音声合成装置は、国語辞典
に記述されている通常の読みを持つ単語辞書と、単語辞
書の読みを話者特有の読みに変換する、話者毎の読み変
換手段と、入力された話者情報から読み変換手段を切り
替え、入力テキストに対して単語辞書と読み変換手段を
用いて音韻情報を生成するテキスト解析手段と、入力テ
キストの韻律情報を生成する韻律情報生成手段と、音韻
情報と韻律情報に基づいて合成音声を生成する合成音声
生成手段を有する。

【００１６】本発明の第５の音声合成方法は、入力テキ
ストに対して、話者の話すとおりの読みとアクセントを
持つ話者別単語辞書と、該話者別単語辞書の読みから話
者特有の読みに変換する読み変換手段を用いて、音韻情
報を生成するテキスト解析段階と、入力テキストの韻律
情報を生成する韻律情報生成段階と、音韻情報と韻律情
報に基づいて合成音声を生成する合成音声生成段階とを
有する。

【００１７】本発明の第５の音声合成装置は、話者の話
すとおりの読みとアクセントを持つ話者別単語辞書と、
該話者別単語辞書の読みから話者特有の読みに変換する
読み変換手段と、入力テキストに対して、話者別単語辞
書と読み変換手段を用いて、音韻情報を生成するテキス
ト解析手段と、入力テキストの韻律情報を生成する韻律
情報生成手段と、音韻情報と韻律情報に基づいて合成音
声を生成する合成音声生成手段とを有する。

【００１８】本発明の第６の音声合成方法は、入力テキ
ストに対して、話者の話すとおりの読みとアクセントを
持つ、話者毎の話者別単語辞書と、該話者別単語辞書の
読みから話者特有の読みに変換する、話者毎の読み変換
手段を用いて、話者毎に話者別単語辞書と読み変換手段
を切り替えて、音韻情報を生成するテキスト解析段階
と、入力テキストの韻律情報を生成する韻律情報生成段
階と、音韻情報と韻律情報に基づいて合成音声を生成す
る合成音声生成段階とを有する。

【００１９】本発明の第６の音声合成装置は、話者の話
すとおりの読みとアクセントを持つ、話者毎の話者別単
語辞書と、該話者別単語辞書の読みから前記話者別単語
辞書と話者特有の読みに変換する、話者毎の読み変換手
段と、入力された話者情報から読み変換手段を切り替
え、入力テキストに対して、話者別単語辞書と読み変換
手段を用いて、音韻情報を生成するテキスト解析手段
と、入力テキストの韻律情報を生成する韻律情報生成手
段と、音韻情報と韻律情報に基づいて合成音声を生成す
る合成音声生成手段とを有する。

【００２０】話者の発音に特化した韻律や変換手段を持
つことで、合成音声の発音情報が元の話者と同じものに
なる。

【００２１】

【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して詳細に説明する。図１を参照する
と、本発明の第１の実施の形態は、テキストを入力する
入力端子１と、入力テキストと話者別単語辞書３を用い
て読みとアクセント、ポーズからなる発音情報を生成す
るテキスト解析部２と、テキスト解析部２で生成された
発音情報に基づいて、イントネーションやリズムのパタ
ンを、音声情報データ６に記憶されている規則やパタン
から生成する韻律情報生成部４と、発音情報と韻律情報
に基づいて音声情報データ６に記憶されている音声パタ
ンを用いて合成音声を生成する合成音声生成部５と、合
成音声生成部５で生成された合成音声を出力する出力端
子７で構成されている。話者別単語辞書３には、各単語
の見出し、品詞、読みとアクセント位置が記憶されてい
る。この話者別単語辞書３を作成する方法としては、例
えば以下のような方法がある。まず、従来音声合成に使
われるような標準的な日本語の発音の入った辞書を用意
しておく。次に、合成に使う話者が本人の発音に近い発
音辞書を作成するために、文や単語を発声したところか
ら抽出した発音情報を単語毎に分割し、該当する辞書の
発音情報と置き換えていく。または、音声合成に使用す
る話者が、音声情報データベースを作成するために収録
した文や単語をのデータがある場合には、そこから抽出
した発音情報を発音辞書に反映させる。このようにし
て、話者特有の発音情報を持つ辞書を作成していく。こ
の話者別単語辞書３には、合成に使う話者が実際に発声
した音声から発音情報を抽出し、記憶しておくため、従
来の発音辞書よりもより個人性が反映されたものとな
る。音声情報データ６には、話者別単語辞書３を作成し
た話者が発声した文や単語から抽出された韻律パタンと
音声波形が、テキスト情報と発音情報、ラベル情報とと
もに記憶されている。次に、本実施形態の動作につい
て詳細に説明する。入力端子１からは、例えば「これを
校正してください。」という文がキーボード等の入力手
段を用いて入力される。テキスト解析部２では、上記入
力文に対し話者別単語辞書３を用いて、/これお；こー
せーしてくださ％い/（“；”は、ポーズ位置、“％”
は、アクセント位置を示す。）のような読みにアクセン
ト情報、ポーズ位置が入った発音情報が生成される。韻
律情報生成部４では、テキスト解析部３で生成された発
音情報にマッチする韻律パタンを音声情報データ６から
選択、編集し、韻律パタンを生成し、発音情報と共に合
成音声生成部５に供給する。合成音声生成部５では、発
音情報と韻律パタンを基に音声情報データ６より音声波
形を選択、編集し、合成音声を作成し、出力端子７より
出力する。表１、表２は話者別単語辞書３の一例であ
り、話者Aと話者Bの発声を基にそれぞれ作られた辞書で
あり、表３は従来音声合成に使われた発声辞書で、アク
セント辞典や国語辞典等の記述によるものである。表
１、表２、表３の単語辞書には、各単語に対し、発音情
報と品詞が記憶されている。

【００２２】

【表１】

【００２３】

【表２】

【００２４】

【表３】これら３つの単語辞書を比較すると、同じ単語の発音情
報が辞書によって異なっていることがわかる。例えば、
「英語」という単語は、表１の話者Aの辞書には、「え
いご」と「い」を比較的はっきり発声するように記述さ
れているが、表２の話者Bや表３では「えーご」と
「え」の長音化のように発声するように記述されてい
る。また、「服」は、表１の話者Aの辞書では、「ふ」
にアクセント核のある１型アクセントだが、表２の話者
Bではアクセントがない０型であり、表３の辞書では、
語尾につく２型となっている。このように、表１から表
３までの辞書のうちいずれかを使うかにより、合成音声
の発音情報は変化する。言い換えれば、ここに話者特有
の発音情報を記述しておくことで、話者の個人性を表現
することが可能となる。次に、本発明の第２の実施の
形態について図面を参照して説明する。図２の本発明の
第２の実施の形態は、第１の実施の形態にある話者別単
語辞書３のかわりに、単語辞書８と読み変換部９を有す
る点で第１の実施形態と異なる。単語辞書８の構造は話
者別単語辞書３と同じであるが、発音情報がある特定の
話者の発声データを基に作成されたのではなく、国語辞
典やアクセント辞典を基に作成されたものである点で話
者別単語辞書３と異なっている。また、読み変換部９
は、単語辞書８で選択された単語の発音情報を規則によ
って変換し、テキスト解析部２へ渡す。このように単語
辞書８と読み変換部９を有することで、第２の実施形態
でも、話者に特化した読みを供給することが可能とな
る。読み変換部９に記憶されている変換規則は、例え
ば、音声合成に使用する話者が、音声情報データベース
を作成するために収録した文や単語のデータを用いて作
成することができる。この規則には、ある特定の単語の
変換規則を記述することもできるが、いくつか実例から
一般化した規則を記述してもよい。例えば、「絵」を/
えー/、「蚊」を/かー/、「子」を/こー/、と長音化す
る話者がいたとする。このような話者は、他の１モーラ
の単語「歯」や「名」等も同様に長音化させる傾向があ
る。そこで、音声合成に使用する話者の発音情報を基
に、話者の発音情報がない単語も変換させるような規則
を記述しておくこともできる。この場合、”「絵」、
「蚊」、「子」は長音化させる”というのが、特定の単
語の変換規則にあたり、”１モーラの単語は長音化す
る。”という規則が一般化された変換規則にあたる。こ
のように、変換規則を一般化しておくことで、音声合成
に使用する話者の発音情報がない単語でも話者特有の発
音情報を変換することができる。

【００２５】次に、本発明の第３の実施の形態について
図面を参照して説明する。図３の本発明の第３の実施の
形態は、第１の実施の形態にある話者別単語辞書３と、
第２の実施の形態にある読み変換部９の両方を有する点
を特徴とする。入力端子１より入力されたテキストはテ
キスト解析部２において、まず、話者別単語辞書３を用
いて単語の発音情報が選択される。選択された発音情報
は、読み変換部９により変換規則にマッチする単語があ
る場合には、発音情報が変換され、テキスト解析部２へ
発音情報として戻される。話者別単語辞書３は、話者が
文や単語を発生した音声から抽出した発音情報を基に作
成されるため、話者が発生していない単語の発音情報は
標準的な日本語のままである。一方、読み変換部９に
は、話者が発生した音声から抽出した発音情報を基に、
それらが一般化された変換規則が格納されている。この
一般化された変換規則を使用することで、話者が発生し
ていないため話者別単語辞書３では変換できない発音情
報を話者性を考慮した発声情報に変換することができ
る。

【００２６】次に、本発明の第４の実施の形態について
図面を参照して説明する。図４の本発明の実施形態は、
第１の実施形態にある話者別単語辞書３と音声情報デー
タ６の組を話者A,B,C毎に話者別単語辞書３Aと音声情報
データ６A、話者別単語辞書３Bと音声情報データ６B、
話者別単語辞書３Cと音声情報データ６Cを備えたもので
ある。話者情報に合わせて、対応する話者別単語辞書と
音声情報データを選択する。話者別単語辞書と音声情報
データには、あらかじめ話者情報を格納しておく。この
ように話者情報に合わせて、話者別単語辞書と音声情報
データを切り替えることでどの話者に対しても、その話
者特有の話し方をする合成音声を生成することができる
ようになる。図５は図４の複数の話者別の話者別単語辞
書と音声情報データの組の切り替え方法の一例を示すブ
ロック図である。テキスト解析部２、韻律情報生成部
４、合成音声部５と話者別単語辞書、音声情報データの
間にスイッチ１０（ここでは単純化ため１個のみ示す）
を設け、このスイッチ１０を話者情報によって切り替え
る。

【００２７】なお、第２の実施形態の読み変換部９を話
者毎に備えてもよく、また第３の実施形態の話者別単語
辞書３と読み変換部９を話者毎に備えてもよい。

【００２８】以上、合成に使用する話者の発音情報を話
者が実際に発声した音声から抽出し、話者別単語辞書や
読み変換規則を生成し、その話者の合成音声を作成する
際に使用することで、元の話者の発声をより忠実に再現
することが可能になる。さらに、これら話者別に話者別
単語辞書や読み変換規則と音声情報データを有し、選択
された話者に合わせてそれらを切り替えることで、どの
合成音声に対しても元の話者の特徴を反映させることが
でき、合成音声のバリエーションも増やすことができる
ようになる。

【００２９】図６は本発明の第１の実施形態をコンピュ
ータを用いて実施した場合のブロック図である。

【００３０】入力装置１１はキーボード等で、テキスト
が入力される。記憶装置１２、１３はそれぞれ図１中の
話者別単語辞書３、音声情報データ６に相当する。記憶
装置１４はハードディスクである。出力装置１５は生成
された合成音声が出力される、スピーカ等である。記録
媒体１６は、図１中のテキスト解析部２、韻律情報生成
部４、合成音声生成部５の各処理からなる音声合成プロ
グラムが記録されている、FD（フロッピィ・ディス
ク）、ＣＤ―ROM、MD（光磁気ディスク）等の記録媒体
である。データ処理装置１７は記録媒体１６から音声合
成プログラムを記憶装置１４に読み込んで、これを実行
するCPU である。

【００３１】なお、その他の実施形態も同様にしてコン
ピュータを用いて実施することができる。

【００３２】

【発明の効果】以上説明したように、本発明は、話者の
発音に特化した辞書や変換手段を持ち、合成音声の発音
情報を元の話者と同じものにすることにより、合成音声
の個人性を向上させることが可能になる。

【図面の簡単な説明】

【図１】本発明の第１の実施の形態の音声合成装置のブ
ロック図である。

【図２】本発明の第２の実施の形態の音声合成装置のブ
ロック図である。

【図３】本発明の第３の実施の形態の音声合成装置のブ
ロック図である。

【図４】本発明の第４の実施の形態の音声合成装置のブ
ロック図である。

【図５】第４の実施形態における話者別単語辞書と音声
情報データのセットの切り替え方法の一例を示す図であ
る。

【図６】第１の実施の形態をコンピュータを用いて実行
する装置のブロック図である。

【図７】音声合成装置の従来例のブロック図である。

【符号の説明】

１入力端子２テキスト解析部３、３A〜３C 話者別単語辞書４韻律情報生成部５合成音声生成部６、６A〜６Ｃ音声情報データ７出力端子８単語辞書９読み変換部１０スイッチ１１入力装置１２、１３、１４記憶装置１５出力装置１６記録媒体１７データ処理装置２１音声情報検索部２２合成音声生成部２３音声情報データベース２４合成音声生成規則

Claims

【特許請求の範囲】

【請求項１】入力テキストに対し、話者の話すとおり
の読みとアクセントを持つ話者別単語辞書を用いて音韻
情報を生成するテキスト解析段階と、前記入力テキストの韻律情報を生成する韻律情報生成段
階と、前記音韻情報と前記韻律情報に基づいて合成音声を生成
する合成音声生成段階とを有する音声合成方法。
【請求項２】前記話者別単語辞書が話者毎に存在し、
前記テキスト解析段階で、入力された話者情報から前記
話者別単語辞書を切り替える、請求項１記載の方法。
【請求項３】入力テキストに対し、国語辞典に記述さ
れている通常の読みを持つ単語辞書と、その読みを話者
特有の読みに変換する読み変換手段を用いて音韻情報を
生成するテキスト解析段階と、前記入力テキストの韻律情報を生成する韻律情報生成段
階と、前記音韻情報と前記韻律情報に基づいて合成音声を生成
する合成音声生成段階とを有する音声合成方法。
【請求項４】入力テキストに対し、国語辞典に記述さ
れている通常の読みを持つ単語辞書と、その読みを話者
特有の読みに変換する、話者毎の読み変換手段を用い
て、話者毎に前記読み変換手段を切り替えて音韻情報を
生成するテキスト解析段階と、前記入力テキストの韻律情報を生成する韻律情報生成段
階と、前記音韻情報と前記韻律情報に基づいて合成音声を生成
する合成音声生成段階とを有する音声合成方法。
【請求項５】入力テキストに対して、話者の話すとお
りの読みとアクセントを持つ話者別単語辞書と、該話者
別単語辞書の読みから話者特有の読みに変換する読み変
換手段を用いて、音韻情報を生成するテキスト解析段階
と、前記入力テキストの韻律情報を生成する韻律情報生成段
階と、前記音韻情報と前記韻律情報に基づいて合成音声を生成
する合成音声生成段階とを有する音声合成方法。
【請求項６】入力テキストに対して、話者の話すとお
りの読みとアクセントを持つ、話者毎の話者別単語辞書
と、該話者別単語辞書の読みから話者特有の読みに変換
する、話者毎の読み変換手段を用いて、話者毎に話者別
単語辞書と読み変換手段を切り替えて、音韻情報を生成
するテキスト解析段階と、前記入力テキストの韻律情報を生成する韻律情報生成段
階と、前記音韻情報と前記韻律情報に基づいて合成音声を生成
する合成音声生成段階とを有する音声合成方法。
【請求項７】話者の話すとおりの読みとアクセントを
持つ話者別単語辞書と、入力テキストに対して前記話者別単語辞書を用いて音韻
情報を生成するテキスト解析手段と、前記入力テキストの韻律情報を生成する韻律情報生成手
段と、前記音韻情報と前記韻律情報に基づいて合成音声を生成
する合成音声生成手段を有する音声合成装置。
【請求項８】話者の話すとおりの読みとアクセントを
持つ、話者毎の話者別単語辞書と、入力された話者情報から前記話者別単語辞書を切り替
え、入力テキストに対して該話者別単語辞書を用いて音
韻情報を生成するテキスト解析手段と、前記入力テキストの韻律情報を生成する韻律情報生成手
段と、前記音韻情報と前記韻律情報に基づいて合成音声を生成
する合成音声生成手段を有する音声合成装置。
【請求項９】国語辞典に記述されている通常の読みを
持つ単語辞書と、前記単語辞書の読みを話者特有の読みに変換する読み変
換手段と、入力テキストに対して前記単語辞書と読み変換手段を用
いて音韻情報を生成するテキスト解析手段と、前記入力テキストの韻律情報を生成する韻律情報生成手
段と、前記音韻情報と前記韻律情報に基づいて合成音声を生成
する合成音声生成手段を有する音声合成装置。
【請求項１０】国語辞典に記述されている通常の読み
を持つ単語辞書と、前記単語辞書の読みを話者特有の読みに変換する、話者
毎の読み変換手段と、入力された話者情報から前記読み変換手段を切り替え、
入力テキストに対して前記単語辞書と該読み変換手段を
用いて音韻情報を生成するテキスト解析手段と、前記入力テキストの韻律情報を生成する韻律情報生成手
段と、前記音韻情報と前記韻律情報に基づいて合成音声を生成
する合成音声生成手段を有する音声合成装置。
【請求項１１】話者の話すとおりの読みとアクセント
を持つ、話者別単語辞書と、該話者別単語辞書の読みから話者特有の読みに変換する
読み変換手段と、入力テキストに対して、前記話者別単語辞書と前記読み
変換手段を用いて、音韻情報を生成するテキスト解析手
段と、前記入力テキストの韻律情報を生成する韻律情報生成手
段と、前記音韻情報と前記韻律情報に基づいて合成音声を生成
する合成音声生成手段とを有する音声合成装置。
【請求項１２】話者の話すとおりの読みとアクセント
を持つ、話者毎の話者別単語辞書と、該話者別単語辞書の読みから話者特有の読みに変換す
る、話者毎の読み変換手段と、入力された話者情報から前記話者別単語辞書と前記読み
変換手段を切り替え、入力テキストに対して、前記話者
別単語辞書と前記読み変換手段を用いて、音韻情報を生
成するテキスト解析手段と、前記入力テキストの韻律情報を生成する韻律情報生成手
段と、前記音韻情報と前記韻律情報に基づいて合成音声を生成
する合成音声生成手段とを有する音声合成装置。
【請求項１３】入力テキストに対し、話者の話すとお
りの読みとアクセントを持つ話者別単語辞書を用いて音
韻情報を生成するテキスト解析手順と、前記入力テキストの韻律情報を生成する韻律情報生成手
順と、前記音韻情報と前記韻律情報に基づいて合成音声を生成
する合成音声生成手順をコンピュータに実行させるため
の音声合成プログラムを記録した記録媒体。
【請求項１４】前記話者別単語辞書が話者毎に存在
し、前記テキスト解析手順で、入力れた話者情報から前
記話者別単語辞書を切り替える、請求項１３記載の記録
媒体。
【請求項１５】入力テキストに対し、国語辞典に記述
されている通常の読みを持つ単語辞書と、その読みを話
者特有の読みに変換する読み変換手段を用いて音韻情報
を生成するテキスト解析手順と、前記入力テキストの韻律情報を生成する韻律情報生成手
順と、前記韻律情報と前記韻律情報に基づいて合成音声を生成
する合成音声生成手順とをコンピュータに実行させるた
めの音声合成プログラムを記録した記録媒体。
【請求項１６】入力テキストに対して、国語辞典に記
述されている通常の読みを持つ単語辞書と、その読みを
話者特有の読みに変換する、話者毎の読み変換手段を用
いて、話者毎に前記読み変換手段を切り替えて音韻情報
情報を生成するテキスト解析手順と、前記入力テキストの韻律情報を生成する韻律情報生成手
順と、前記音韻情報と前記韻律情報に基づいて合成音声を生成
する合成音声生成手順とをコンピュータに実行させるた
めの音声合成プログラムを記録した記録媒体。
【請求項１７】入力テキストに対して、話者の話すと
おりの読みとアクセントを持つ話者別単語辞書と、該話
者別単語辞書の読みから話者特有の読みに変換する読み
変換手段を用いて、音韻情報を生成するテキスト解析手
順と、前記入力テキストの韻律情報を生成する韻律情報生成手
順と、前記音韻情報と前記韻律情報に基づいて合成音声を生成
する合成音声生成手順とをコンピュータに実行させるた
めの音声合成プログラムを記録した記録媒体。
【請求項１８】入力テキストに対し、話者の話すとお
りの読みとアクセントを持つ、話者毎の話者別単語辞書
と、該話者別単語辞書の読みから話者特有の読みに変換
する、話者毎の読み変換手段を用いて、話者毎に話者別
単語辞書と読み変換手段を切り替えて、音韻情報を生成
するテキスト解析手順と、前記入力テキストの韻律情報を生成する韻律情報生成手
順と、前記音韻情報と前記韻律情報に基づいて合成音声を生成
する合成音声生成手順とをコンピュータに実行させるた
めの音声合成プログラムを記録した記録媒体。