JP3648456B2

JP3648456B2 - 音声合成装置

Info

Publication number: JP3648456B2
Application number: JP2001003395A
Authority: JP
Inventors: 慶子吹田; 浩幸勘座
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 2001-01-11
Filing date: 2001-01-11
Publication date: 2005-05-18
Anticipated expiration: 2021-01-11
Also published as: JP2002207494A

Description

【０００１】
【発明の属する技術分野】
本発明は、音声合成装置に関する。特に、入力文のフォーマットに関する特徴を検出し、その特徴に応じた適切な読み上げを行う音声合成装置に関する。
【０００２】
【従来の技術】
従来の音声合成装置では、どのような内容の文章を読み上げても、声質や韻律的特徴は画一的なものであった。特開平９−６２２８６号公報では、入力文に応じて適切な韻律の合成音を提供可能な音声合成装置が開示されている。この音声合成装置は、入力文からキーワードを検出して入力文が属する分野を決定し、決定された分野に基づいて韻律情報を生成することにより、分野毎に韻律が異なる合成音の生成を行っている。
【０００３】
【発明が解決しようとする課題】
しかしながら、上記音声合成装置では、予め分野毎のキーワードを用意する必要があり、また、キーワードと一致する単語を含まない文章については適用することができない。
【０００４】
本発明は、キーワード検出によらず、文章のフォーマットに関する特徴を検出して解析することにより、文章の内容に応じた適切な読み上げが可能な音声合成装置を提供することを主な目的とする。
【０００５】
【課題を解決するための手段】
本発明は、入力文に対応する合成音を出力する音声合成装置において、上記入力文に対応する文字情報を読み込む手段と、箇条書検出部 , 文字寄せ検出部 , 段落検出部 , 文字数バラツキ検出部 , 漢字出現率算出部 , 記号出現率算出部 , 引用部検出部 , 文末記号検出部および強調文字検出部のうちの少なくとも何れか一つを含むと共に、上記読み込まれた文字情報中の文字コード又は位置情報に基づいて上記入力文のフォーマットの特徴を検出する手段と、上記箇条書検出部 , 文字寄せ検出部 , 段落検出部 , 文字数バラツキ検出部 , 漢字出現率算出部 , 記号出現率算出部 , 引用部検出部 , 文末記号検出部および強調文字検出部のうちの少なくとも何れか一つによる検出結果又は算出結果に従って、上記入力文の文意の種類がくだけた文章 , 通達文 , レポート文およびニュース記事のうちの何れであるかを判断する手段と、上記文意の種類に応じて上記合成音を生成する手段と、を有することを特徴とする音声合成装置を提供する。
【０００６】
本発明によれば、入力文のフォーマットの特徴を検出し、その特徴に基づいて合成音を生成できるため、予め分野毎のキーワードを用意する必要がなく、また、キーワードと一致する単語を含まない文章についても、文章のフォーマットに応じた適切な読み上げが可能である。
【０００７】
さらに、上記箇条書検出部,文字寄せ検出部,段落検出部,文字数バラツキ検出部,漢字出現率算出部,記号出現率算出部,引用部検出部,文末記号検出部および強調文字検出部のうちの少なくとも何れか一つによって上記入力文のフォーマットの特徴を検出し、上記箇条書検出部 , 文字寄せ検出部 , 段落検出部 , 文字数バラツキ検出部 , 漢字出現率算出部 , 記号出現率算出部 , 引用部検出部 , 文末記号検出部および強調文字検出部のうちの少なくとも何れか一つによる検出結果又は算出結果に従って、上記入力文の文意の種類がくだけた文章 , 通達文 , レポート文およびニュース記事のうちの何れかであるかを判断するため、入力文の文意の種類を的確に判断することが可能である。
【０００８】
また、本発明は、上記生成する手段は、文意の種類に対応する韻律生成規則を選択し、該規則に基づいて上記合成音の韻律情報を生成することを特徴とする音声合成装置を提供する。
【０００９】
本発明によれば、文意の種類に応じて韻律情報を生成するため、入力文の文意に応じた韻律で入力文を読み上げることができる。
【００１０】
また、本発明は、上記生成する手段は、文意の種類に対応する辞書を選択し、該辞書に基づいて上記入力文の言語解析を行うことを特徴とする音声合成装置を提供する。
【００１１】
本発明によれば、文意の種類に対応する辞書が優先して使用されるため、入力文の文意に応じたより自然な読み上げが可能である。
【００１２】
また、本発明は、上記検出された特徴に基づいて上記入力文の区切り位置を決定する手段をさらに有し、上記生成する手段は、上記区切り位置に基づいて上記合成音を生成することを特徴とする音声合成装置を提供する。
【００１３】
本発明によれば、入力文のフォーマットの特徴から適切な区切り位置を決定して合成音を生成するため、入力文を滑らかに読み上げることができる。
【００１４】
また、本発明は、上記入力文が電子メールの文章であって、各行の文字数の差分が所定値以下である場合に、上記決定する手段は、上記入力文の各行の改行コードが存在する位置では入力文を区切らないように決定することを特徴とする音声合成装置を提供する。
【００１５】
本発明によれば、文章の言語解析を行う場合、通常、改行コードの位置で文章を区切ることが多いが、電子メールの文章にバラツキが少ない場合、すなわち、各行の文字数が略同一である場合は、各行の文字数を合わせるためにユーザが強制的に改行を入力していると判断し、各行の改行コードの位置では文章を区切らないように決定することにより、不自然な文章の途切れを防止し、入力文を滑らかに読み上げることができる。
【００１６】
【発明の実施の形態】
（実施の形態１）
図１は、本発明に係る音声合成装置の一形態を示す機能ブロック図である。１７は本実施の形態に係る音声合成装置である。
【００１７】
図１中のテキストは、音声合成装置１７に入力される文字情報のことであり、例えば、ＡＳＣＩＩコードやＪＩＳコード等の所謂文字コードで示されるデータ列や文字寄せなどを示す位置情報などのことである。本実施の形態では、音声合成装置１７は汎用のパーソナルコンピュータに内蔵され、電子メールやＷｅｂページあるいは電子ファイル形式の文書などのテキストを音声合成して出力する場合について説明を行うが、本発明はこれに限定されるものではなく、入力されたテキストに対して音声合成を行うような装置全般に対して適用可能である。
【００１８】
図１に基づいて、テキストが入力されてから合成音を出力するまでの音声合成装置１７における処理の流れを説明する。
【００１９】
音声合成装置１７に入力されたテキストは、言語解析部２において、周知の形態素解析や辞書引き等によりテキストの言語解析が行われ、音声合成に必要な読みや韻律などの情報がテキストに付与される。次に、韻律情報生成部３において、言語解析部２から出力される読みや韻律などの情報から韻律情報が生成され、音声合成部４において音声が合成され、出力部５から合成音が出力される。
【００２０】
一方、音声合成装置１７に入力されたテキストは、上述のように言語解析部２に入力されると共に、フォーマット解析部１にも入力され、テキストに対応する文字情報が読み込まれる。その後、読み込まれた文字情報が、入力文のフォーマットの特徴を特定する予め定められた規則と一致するか否かが判定され、一致する場合にその一致した規則に対応するフォーマットの特徴が検出される。そして、その検出されたフォーマットの特徴に基づいてテキストの文意の種類が判断され、文意の種類を示す情報が出力される。ここで、入力テキストのフォーマットの特徴とは、そのテキストに含まれる箇条書きがあるか否か、文字寄せがあるか否か、段落があるか否か、各行の文字数のバラツキ度合い、漢字の占める割合、記号の占める割合、引用部があるか否か、文末記号の種類、強調文字があるか否かなどのことである。また、文意の種類とは、そのテキストの内容がニュース記事であるとか、レポート文であるとか、通達文であるとか、くだけた文章であるとか、形式ばった文章であるとかのことを意味する。
【００２１】
そして、フォーマット解析部１において解析されたテキストの文意の種類を示す情報は、言語解析部２、韻律情報生成部３、音声合成部４に出力され、それぞれにおいて、文意の種類に応じた制御が成され、合成音が生成される。なお、文意の種類に応じて合成音を生成する具体的な例については、実施の形態２〜実施の形態４において説明する。
【００２２】
また、フォーマット解析部１では、検出された入力テキストのフォーマットの特徴に基づいて入力テキストの区切り位置が決定され、その区切り位置を示す情報はテキストの特徴を示す情報と共に言語解析部２に出力される。なお、区切り位置に基づいて合成音を生成する具体的な例については、実施の形態５において説明する。
【００２３】
なお、図１において、フォーマット解析部１から出ている点線は、入力テキストのフォーマットの特徴に基づいて生成される情報が、言語解析部２又は韻律情報生成部３又は音声合成部４又はそれらの組み合わせに対して出力されることを示している。
【００２４】
図２は、フォーマット解析部１の詳細な機能ブロック図である。フォーマット解析部１では、入力されたテキストに対応する文字情報を読み込み（図示せず）、特徴検出部１５でその文字情報が、入力文のフォーマットの特徴を特定する予め定められた規則と一致するか否かを判定し、一致する場合にその一致した規則に対応する特徴が検出される。そして、フォーマット分類部１６において、その特徴に基づいて、そのテキストの文意の種類が判断され、文意の種類を示す情報が出力される。
【００２５】
特徴検出部１５は、箇条書検出部６、文字寄せ検出部７、段落検出部８、文字数バラツキ検出部９、漢字出現率算出部１０、記号出現率算出部１１、引用部検出部１２、文末記号検出部１３、強調文字検出部１４で構成されており、各部ではそれぞれ、入力テキストの文字情報からフォーマットの特徴を検出するための規則が予め設定されている。なお、特徴検出部１５は、上記各部の全部で構成される必要はなく、その一部で構成されていても良い。
【００２６】
次に、特徴検出部１５の各部におけるフォーマットの特徴を検出するための規則について説明する。
【００２７】
箇条書検出部６では、テキストに箇条書きがあるか否かを検出する。箇条書きの検出は例えば次のようにして行われる。すなわち、複数行の先頭文字が同じ記号である場合（図３における記号「・」）、複数行の先頭文字が数字であり、かつ、その各数字の並びが続き番号になっている場合（図４）、複数行の先頭文字が同じ記号であり、かつ、先頭文字の次の文字が数字であり、かつ、その各数字の並びが続き番号になっている場合（図５）、複数行の先頭文字列が均等割付されており、かつ、その直後に同じ数の空白になっている場合（図６）などである。なお、図３〜図６に示す上記例においては、箇条書を示す複数行の各行が１行単位で示されているが、各行がそれぞれ複数行になっていても良い。また、図６における均等割付された文字列の直後は空白ではなく、例えば「：」などの記号であっても良い。
【００２８】
文字寄せ検出部７では、各行の文字列が、右寄せ、左寄せ、又は中央寄せなどの所謂文字寄せがあるかどうか、又は、その文字寄せされた文字列が均等割付されているかどうかを検出する。文字寄せの検出は、例えば、入力テキストの文字情報中の文字寄せを示す位置情報に基づいて行われる。
【００２９】
段落検出部８では、テキスト中に段落が存在するかどうかを検出する。段落は、文章と文章との間に空白行が挿入されている場合に段落ありと判断される。
【００３０】
文字数バラツキ検出部９では、各行の文字数をカウントして、各行の文字数のバラツキを検出する。各行の文字数が略同一である場合はバラツキ度合いは低いと判断される。逆に各行の文字数が大きく異なる場合はバラツキ度合いは高いと判断される。すなわち、各行の文字数の差分を取り、その差分値が所定値以下ならばバラツキ度合いは低いと判断され、所定値以上ならばバラツキ度合いは高いと判断される。
【００３１】
漢字出現率算出部１０では、テキストの全文中から漢字を抽出し、全文字数に占める漢字の数で表される漢字出現率を算出する。漢字の抽出は、ひらがな、カタカナ、数字、記号以外の文字を漢字とみなして行う。
【００３２】
記号出現率算出部１１では、テキストの全文中から記号を抽出し、全文字数に占める記号の数で表される記号出現率を算出する。
【００３３】
引用部検出部１２では、電子メール文の引用部を検出する。引用部の検出は、各行の先頭文字が、例えば「＞」などの予め設定された引用記号であるかどうかで判断される。
【００３４】
文末記号検出部１３では、各行の最終文字が句点記号であるか、又はそれ以外の記号であるかを検出する。文末記号の検出は、各行の最終文字が、例えば、「！」や「？」や「…」などの予め設定された句点以外の記号であるかどうかで判断される。
【００３５】
強調文字検出部１４では、テキスト中に強調文字があるかどうかを検出する。強調文字の検出は、テキスト中の文字に下線や太字などが付加されているかどうかで判断される。
【００３６】
上述のように、特徴検出部１５では、読み込まれた文字情報中の文字コードに基づいて入力テキストのフォーマットに関する特徴を検出する。すわなち、例えば、箇条書検出部６において、読み込まれた文字情報中に、予め箇条書検出部６で定められた規則である複数行の先頭文字が同じ記号であるという文字コードパターンを含む場合、その入力テキストのフォーマットの特徴は、箇条書きがあるという特徴であると特定し、その情報を検出する。
【００３７】
また、特徴検出部１５では、読み込まれた文字情報中の位置情報に基づいて入力テキストのフォーマットに関する特徴を検出する。すわなち、例えば、文字寄せ検出部７において、読み込まれた文字情報中に、右寄せがあるという位置情報を含む場合、その入力テキストのフォーマットの特徴は、右寄せがあるという特徴であると特定し、その情報を検出する。
【００３８】
なお、上述の特徴検出部１５の各部における入力テキストの各文字の検出は、例えば「＞」文字を検出するにはそれに対応した文字コードを検出すればよく、これらの処理は周知のソフトウエア技術で行うことができる。
【００３９】
フォーマット分類部１６では、特徴検出部１５の各部で検出された結果に基づいて入力テキストを、友人同士でやり取りされる手紙（電子メール）などのくだけた文章、強調文字や文字寄せなどを利用して開催日程などを知らせる通達文や箇条書きを多用するレポート文などの形式ばった文章、ニュース記事などのように文意の種類を判断して分類し、その文意の種類を示す情報を出力する。上記の分類は、例えば、入力されたテキストに、箇条書きと文字寄せと段落があり、各段落内の文字数にバラツキがない場合は、フォーマットが形式ばっていることから通達文であると判断するといったように、経験則からその分類する条件を設定すればよい。例として、入力テキストが電子メールの場合におけるフォーマット分類部１６の処理を示すフローチャートを図７に示す。
【００４０】
図７を参照してフォーマット分類部１６の処理を説明すると次のようになる。引用部検出部１２で引用部が検出されている場合は、友人同士でメールのやり取りをしている確立が高いと判断して、そのテキストはくだけた文章に分類される（Ｓ２０１）。Ｓ２０１で引用部がないとされ、段落検出部８で段落が検出されていない場合も、友人同士でメールのやり取りをしている確立が高いと判断して、そのテキストはくだけた文章に分類される（Ｓ２０２）。Ｓ２０２で段落が検出されており、漢字出現率算出部１０で算出された値が所定値（Ｋ％）以下の場合も、漢字の使用頻度が低いため、友人同士でメールのやり取りをしている確立が高いと判断して、そのテキストはくだけた文章に分類される（Ｓ２０３）。Ｓ２０３で所定値（Ｋ％）以上であり、記号出現率が所定値（Ｙ％）より大きい場合は、そのテキストはニュース記事であると分類される（Ｓ２０４）。Ｓ２０４で所定値（Ｙ％）以下であり、文末記号検出部１３で行の最終文字が句点以外の記号、例えば「！」又は「？」である場合は、友人同士でメールのやり取りをしている確立が高いと判断して、そのテキストはくだけた文章に分類される。なお、この場合、テキストの複数行のうち１行でもこの条件を満たせばくだけた文章であると判断してもよいし、複数行のうち所定数以上この条件を満たせばくだけた文章であると判断するようにしてもよい。Ｓ２０５で行の最終文字が句点であり、強調文字検出部１４で強調文字が検出されるか、又は、文字寄せ検出部７で文字寄せが検出されている場合は、そのテキストは開催日程などを知らせる比較的レイアウトを重視した通達文に分類される（Ｓ２０６）。Ｓ２０６で強調文字、文字寄せの双方が検出されず、箇条書検出部６で箇条書きが検出されている場合は、そのテキストは形式ばった文章のレポート文に分類される（Ｓ２０７）。Ｓ２０７で箇条書きが検出されない場合は、そのテキストはくだけた文章に分類される。
【００４１】
なお、図７の例では、入力テキストの文意の種類を４つに分類したが、例えば、メールなどのくだけた文章とレポート文などの形式ばった文章の２種類に分類したり、さらにそれにニュース記事などのやや形式ばった文章を加えて３種類に分類するといったように、分類する数や種類はこれに限定されるものではない。また、図７の例は、フォーマット分類部１６において入力テキストの文意の種類を判断する際の一例を示すものであり、図７のフローチャートで示す全ての条件を使用する必要はなく、その一部だけを使用して判断するようにしても良い。
【００４２】
（実施の形態２）
図８は、本発明に係る音声合成装置の別の形態を示す機能ブロック図である。図１と同一の構成要素には同一の符号を付し、同じ説明は省略する。
【００４３】
韻律情報生成部３内の韻律生成規則選択部１８では、フォーマット解析部１から出力された文意の種類を示す情報に対応した韻律生成規則を選択する。韻律生成規則とは、テキストの種類に応じて予め設定されたピッチ長、ピッチ変動幅、発声速度、ポーズ長などの韻律生成のためのパラメータのことであり、例えば、文意の種類を示す情報がくだけた文章である場合は、ピッチ変動幅は大きく設定されており、抑揚が明確に出るように制御されている。また、文意の種類を示す情報がくだけた文章である場合は比較的簡単な単語を多く含んでいるため聞き取り易いことから、発声速度は速めに設定され、かつ、ポーズ長は短めに設定されており、人間が普通に会話するような速度で読み上げるように制御されている。また、文意の種類を示す情報がレポート文などのように形式ばった文章である場合は、落ち着いたトーンで読み上げるようにピッチ長を設定する。文意の種類を示す情報が通達文などのように箇条書きの多い文章である場合は、聞き取り易いように発声速度は遅めに設定され、ポーズ長は長めに設定される。なお、上述の規則は一例である。また、予めその規則を設定しておくのではなく、ユーザがその規則を自由に設定できるようにしておいても良い。
【００４４】
このように、テキストの書式からその文意の種類が分類され、その文意の種類に応じて合成音の韻律情報を生成するため、テキストの文意に応じた韻律でテキストを読み上げることが可能になる。特に、入力テキストが電子メールであり、連続して複数の電子メールを読み上げる場合は、電子メール毎にその内容に応じた韻律で読み上げられることから、文章の内容を韻律から把握することが可能である。
【００４５】
（実施の形態３）
図９は、本発明に係る音声合成装置の別の形態を示す機能ブロック図である。図１と同一の構成要素には同一の符号を付し、同じ説明は省略する。
【００４６】
言語解析部２内の辞書選択部１９では、フォーマット解析部１から出力された文意の種類を示す情報に対応した辞書を選択する。この選択された辞書は言語解析部２で使用される。例えば、文意の種類を示す情報がくだけた文章である場合は、話し言葉用辞書を選択し、言語解析部２においてこの話し言葉用辞書が通常使用される辞書よりも優先して使用されるように制御する。友人間でやり取りされる電子メールの文章は話し言葉で書かれている場合が多いため、話し言葉用辞書を選択することによって、より正しく形態素解析を行うことが可能になる。
【００４７】
また、語尾に「○○ですー」や「××なんだ〜」などの話し言葉特有の読み上げ方を特徴付ける記号（この場合、「ー」や「〜」）がある場合には、その記号に適した韻律規則を予め話し言葉用辞書に設定しておくことにより、より話し言葉調に近い韻律を生成することが可能になる。
【００４８】
また、箇条書きであると判断された場合には、箇条書きを表す先頭文字（例えば、図３に示す記号「・」）は読み上げないように予め話し言葉用辞書に設定しておくようにしても良い。
【００４９】
また、友人間でやり取りされる電子メールの文章などの話し言葉の文章では、例えば「○○を書いてマス。」というように単語の一部をカタカナで書いたりすることがあり、予め話し言葉用辞書にそのようなカタカナはひらがなに直すように設定しておくことにより、言語解析部２において正しい言語解析を行うことができ、より自然な読み上げが可能になる。
【００５０】
（実施の形態４）
図１０は、本発明に係る音声合成装置の別の形態を示す機能ブロック図である。図１と同一の構成要素には同一の符号を付し、同じ説明は省略する。
【００５１】
音声合成部４内の声質選択部２０では、フォーマット解析部１から出力された文意の種類を示す情報に対応した声質を選択する。この選択された声質は、合成音声部４で使用される。声質選択部２０では、予め複数の声質を用意しておき、例えば、文意の種類を示す情報が通達文やレポート文などの形式ばった文章である場合は低い声にするなど、文意の種類に応じて適切な声質を予め設定しておく。
【００５２】
このように、テキストのフォーマットを解析して分類することにより、文章の内容に応じた声質を選択することが可能であり、様々な文章に対して異なる声質で読み上げることが可能である。
【００５３】
（実施の形態５）
図１１は、本発明に係る音声合成装置の別の形態を示す機能ブロック図である。図１と同一の構成要素には同一の符号を付し、同じ説明は省略する。
【００５４】
フォーマット解析部１は、特徴検出部１５の各部において検出されたテキストの特徴を示す情報及びそのテキスト中の位置を示す情報を区切り位置決定部２１に出力する。つまり、特徴検出部１５の箇条書検出部６で箇条書きが検出された場合は、箇条書きが検出されたことを示す情報及びその位置情報が出力され、また、文字寄せ検出部７で文字寄せが検出された場合は、文字寄せが検出されたことを示す情報及びその位置情報が出力される。なお、特徴検出部１５の各部で複数の特徴が検出された場合は、その全ての情報を出力するようにしておく。
【００５５】
区切り位置決定部２１では、テキストの特徴を示す情報及びその位置情報に基づいて言語解析部２で解析されるテキストの文や単語の区切り位置を決定する。
【００５６】
まず、文を区切る位置を決定するための文区切り規則の例について説明する。
【００５７】
例えば、入力テキストに箇条書きがある場合は、文章の内容はそれぞれの箇条書き毎に区切られているため、その箇条書きの行については改行の位置でその文を区切るように決定すれば、箇条書きのそれぞれの行を滑らかに読み上げることができる。すなわち、区切り位置決定部２１は、テキストに箇条書きの特徴があることを示す情報を検出した場合は、言語解析部２に対してその箇条書きの行については改行コードの位置でその文を区切るように命令すれば良い。また、テキストに文字寄せがある場合についても同様に、文字寄せの行とその次の行とは文章の内容が異なるため、区切り位置決定部２１は、テキストに文字寄せの特徴を示す情報を検出した場合は、言語解析部２に対してその文字寄せの行については改行コードの位置でその文を区切るように命令する。そうすることにより、箇条書きの行とその次の行とを滑らかに読み上げることが可能になる。
【００５８】
また、電子メールなどで、入力テキストの各行の文字数のバラツキが少ない場合は、各行の文字数を合わせて複数行を全体として見やすくするために、ユーザが自ら改行を入力している場合が多いため、その改行では文を区切らないように決定すれば、その行とその次の行とを滑らかに読み上げることができる。すなわち、区切り位置決定部２１は、バラツキ度合いが低い場合、つまり各行の文字数の差分が所定値以下であるという特徴を示す情報を検出した場合は、言語解析部２に対してその各行における改行コードを無視してその位置では文を区切らないように命令すれば良い。
【００５９】
また、電子メールなどで、入力テキストに段落がある場合は、段落ごとに文章の内容が異なっている場合が多いため、段落中の改行ではその文を区切らないように決定すれば、文章を滑らかに読み上げることができる。すなわち、区切り位置決定部２１は、テキストに段落があるという特徴を示す情報を検出した場合は、言語解析部２に対してその段落中の改行コードを無視してその位置では文を区切らないよう命令すれば良い。なお、１つの段落中で極端に文字数が少ない行がある場合は、その位置で文章の内容が変化している可能性が高いため、その行末の改行コードで文を区切るようにしても良い。
【００６０】
また、電子メールなどで、入力テキストに引用部がある場合は、相手先からの返信の際にメールサーバなどで強制的に改行コードが挿入された可能性が高いため、引用部中の改行ではその文を区切らないように決定すれば、文章を滑らかに読み上げることができる。すなわち、区切り位置決定部２１は、テキストに引用部があるという特徴を示す情報を検出した場合は、言語解析部２に対してその引用部中の改行コードを無視してその位置では文を区切らないように命令すれば良い。
【００６１】
上述の文区切り規則の例のように、入力テキストのフォーマットの特徴から文の区切りを決定することにより、句点などの文の区切りを示す記号を検出してその位置で文を区切る場合に比べて、例えば、文章の見出しを記した行において句点がない場合や、誤って文の途中で改行してしまった場合などにおける文の区切りの誤検出を低く抑えることができる。なお、上述の文区切り規則の例に、文の区切りを示す記号による手法を組み合わせて、入力テキストの文の区切りを決定するようにしても良い。
【００６２】
次に、文字の間に空白（所謂スペース）がある場合の単語区切り規則について説明する。この単語区切り規則では、文字の間に空白が挿入されている文字列において、その空白を削除して空白の前後の文字を結合するかどうかを決定する。
【００６３】
例えば、入力テキストに箇条書きがあり、かつ、文字列の文字寄せが均等割付になっている場合は、均等割付された文字列から空白を削除し、空白の前後の文字を結合する。すなわち、区切り位置決定部２１は、テキストに箇条書きがあるという特徴を示す情報及び均等割付があるという特徴を示す情報が含まれている場合は、言語解析部２に対してその空白を削除し、空白の前後の文字を結合するように命令する。こうすることにより、空白によって文字列が区切られること無く、言語解析部２において、その文字列を単語として解析することができる。
【００６４】
上述の単語区切り規則の例のように、入力テキストのフォーマットの特徴から単語の区切りを決定することにより、改行の前後又は空白の前後で文章を結合して形態素解析を行う手法に比べて、計算量を低く抑えることができる。
【００６５】
なお、上述の実施の形態１〜実施の形態５における音声合成装置の各構成を任意に組み合わせた音声合成装置を提供することも可能である。このように各構成を任意に組み合わせた場合でも、それぞれの実施の形態で説明した同様の作用効果を奏することは明らかである。
【００６６】
また、上述の各実施の形態における処理の一部又は全部をコンピュータによる処理に適した命令の順番付けられた列からなるもの（プログラム）として提供することも可能である。また、そのプログラムのインストール、実行、プログラムの流通のために、そのプログラムを記録したコンピュータ読取可能な記録媒体として提供することも可能である。
【００６７】
【発明の効果】
本発明によれば、入力テキストのフォーマットの特徴を検出し、その特徴に基づいて音声合成を行うため、入力テキストの文意に応じた適切な読み上げが可能である。
【００６８】
さらに、上記箇条書検出部 , 文字寄せ検出部 , 段落検出部 , 文字数バラツキ検出部 , 漢字出現率算出部 , 記号出現率算出部 , 引用部検出部 , 文末記号検出部および強調文字検出部のうちの少なくとも何れか一つによって上記入力文のフォーマットの特徴を検出し、上記箇条書検出部 , 文字寄せ検出部 , 段落検出部 , 文字数バラツキ検出部 , 漢字出現率算出部 , 記号出現率算出部 , 引用部検出部 , 文末記号検出部および強調文字検出部のうちの少なくとも何れか一つによる検出結果又は算出結果に従って、上記入力文の文意の種類がくだけた文章 , 通達文 , レポート文およびニュース記事のうちの何れであるかを判断するため、入力文の文意の種類を的確に判断することが可能である。
【００６９】
また、本発明によれば、入力テキストのフォーマットの特徴から適切な区切り位置を決定して合成音を生成するため、入力テキストを滑らかに読み上げることが可能である。
【図面の簡単な説明】
【図１】本発明の実施の形態１における音声合成装置の機能ブロック図である。
【図２】本発明の実施の形態１におけるフォーマット解析部の機能ブロック図である。
【図３】本発明の実施の形態１における、箇条書きを有するテキストのフォーマットを示す概略図の第１の例である。
【図４】本発明の実施の形態１における、箇条書きを有するテキストのフォーマットを示す概略図の第２の例である。
【図５】本発明の実施の形態１における、箇条書きを有するテキストのフォーマットを示す概略図の第３の例である。
【図６】本発明の実施の形態１における、箇条書きを有するテキストのフォーマットを示す概略図の第４の例である。
【図７】本発明の実施の形態１におけるフォーマット解析部のフローチャートである。
【図８】本発明の実施の形態２における音声合成装置の機能ブロック図である。
【図９】本発明の実施の形態３における音声合成装置の機能ブロック図である。
【図１０】本発明の実施の形態４における音声合成装置の機能ブロック図である。る。
【図１１】本発明の実施の形態５における音声合成装置の機能ブロック図である。
【符号の説明】
１フォーマット解析部
２言語解析部
３韻律情報生成部
４音声合成部
１７音声合成装置

Claims

入力文に対応する合成音を出力する音声合成装置において、
上記入力文に対応する文字情報を読み込む手段と、
箇条書検出部 , 文字寄せ検出部 , 段落検出部 , 文字数バラツキ検出部 , 漢字出現率算出部 , 記号出現率算出部 , 引用部検出部 , 文末記号検出部および強調文字検出部のうちの少なくとも何れか一つを含むと共に、上記読み込まれた文字情報中の文字コード又は位置情報に基づいて上記入力文のフォーマットの特徴を検出する手段と、
上記箇条書検出部 , 文字寄せ検出部 , 段落検出部 , 文字数バラツキ検出部 , 漢字出現率算出部 , 記号出現率算出部 , 引用部検出部 , 文末記号検出部および強調文字検出部のうちの少なくとも何れか一つによる検出結果又は算出結果に従って、上記入力文の文意の種類がくだけた文章 , 通達文 , レポート文およびニュース記事のうちの何れであるかを判断する手段と、
上記文意の種類に応じて上記合成音を生成する手段と、
を有することを特徴とする音声合成装置。
上記生成する手段は、文意の種類に対応する韻律生成規則を選択し、該規則に基づいて上記合成音の韻律情報を生成することを特徴とする請求項１に記載の音声合成装置。
上記生成する手段は、文意の種類に対応する辞書を選択し、該辞書に基づいて上記入力文の言語解析を行うことを特徴とする請求項１に記載の音声合成装置。
上記検出されたフォーマットの特徴に基づいて上記入力文の区切り位置を決定する手段をさらに有し、
上記生成する手段は、上記区切り位置に基づいて上記合成音を生成する
ことを特徴とする請求項１に記載の音声合成装置。
上記入力文が電子メールの文章であって、各行の文字数の差分が所定値以下である場合に、上記決定する手段は、上記入力文の各行の改行コードが存在する位置では入力文を区切らないように決定することを特徴とする請求項４に記載の音声合成装置。