JP3648456B2 - 音声合成装置 - Google Patents

音声合成装置 Download PDF

Info

Publication number
JP3648456B2
JP3648456B2 JP2001003395A JP2001003395A JP3648456B2 JP 3648456 B2 JP3648456 B2 JP 3648456B2 JP 2001003395 A JP2001003395 A JP 2001003395A JP 2001003395 A JP2001003395 A JP 2001003395A JP 3648456 B2 JP3648456 B2 JP 3648456B2
Authority
JP
Japan
Prior art keywords
sentence
character
detection unit
text
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001003395A
Other languages
English (en)
Other versions
JP2002207494A (ja
Inventor
慶子 吹田
浩幸 勘座
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2001003395A priority Critical patent/JP3648456B2/ja
Publication of JP2002207494A publication Critical patent/JP2002207494A/ja
Application granted granted Critical
Publication of JP3648456B2 publication Critical patent/JP3648456B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、音声合成装置に関する。特に、入力文のフォーマットに関する特徴を検出し、その特徴に応じた適切な読み上げを行う音声合成装置に関する。
【0002】
【従来の技術】
従来の音声合成装置では、どのような内容の文章を読み上げても、声質や韻律的特徴は画一的なものであった。特開平9−62286号公報では、入力文に応じて適切な韻律の合成音を提供可能な音声合成装置が開示されている。この音声合成装置は、入力文からキーワードを検出して入力文が属する分野を決定し、決定された分野に基づいて韻律情報を生成することにより、分野毎に韻律が異なる合成音の生成を行っている。
【0003】
【発明が解決しようとする課題】
しかしながら、上記音声合成装置では、予め分野毎のキーワードを用意する必要があり、また、キーワードと一致する単語を含まない文章については適用することができない。
【0004】
本発明は、キーワード検出によらず、文章のフォーマットに関する特徴を検出して解析することにより、文章の内容に応じた適切な読み上げが可能な音声合成装置を提供することを主な目的とする。
【0005】
【課題を解決するための手段】
本発明は、入力文に対応する合成音を出力する音声合成装置において、上記入力文に対応する文字情報を読み込む手段と、箇条書検出部 , 文字寄せ検出部 , 段落検出部 , 文字数バラツキ検出部 , 漢字出現率算出部 , 記号出現率算出部 , 引用部検出部 , 文末記号検出部および強調文字検出部のうちの少なくとも何れか一つを含むと共に、上記読み込まれた文字情報中の文字コード又は位置情報に基づいて上記入力文のフォーマットの特徴を検出する手段と、上記箇条書検出部 , 文字寄せ検出部 , 段落検出部 , 文字数バラツキ検出部 , 漢字出現率算出部 , 記号出現率算出部 , 引用部検出部 , 文末記号検出部および強調文字検出部のうちの少なくとも何れか一つによる検出結果又は算出結果に従って、上記入力文の文意の種類がくだけた文章 , 通達文 , レポート文およびニュース記事のうちの何れであるかを判断する手段と、上記文意の種類に応じて上記合成音を生成する手段と、を有することを特徴とする音声合成装置を提供する。
【0006】
本発明によれば、入力文のフォーマットの特徴を検出し、その特徴に基づいて合成音を生成できるため、予め分野毎のキーワードを用意する必要がなく、また、キーワードと一致する単語を含まない文章についても、文章のフォーマットに応じた適切な読み上げが可能である。
【0007】
さらに、上記箇条書検出部,文字寄せ検出部,段落検出部,文字数バラツキ検出部,漢字出現率算出部,記号出現率算出部,引用部検出部,文末記号検出部および強調文字検出部のうちの少なくとも何れか一つによって上記入力文のフォーマットの特徴を検出し、上記箇条書検出部 , 文字寄せ検出部 , 段落検出部 , 文字数バラツキ検出部 , 漢字出現率算出部 , 記号出現率算出部 , 引用部検出部 , 文末記号検出部および強調文字検出部のうちの少なくとも何れか一つによる検出結果又は算出結果に従って、上記入力文の文意の種類がくだけた文章 , 通達文 , レポート文およびニュース記事のうちの何れかであるかを判断するため、入力文の文意の種類を的確に判断することが可能である。
【0008】
た、本発明は、上記生成する手段は、文意の種類に対応する韻律生成規則を選択し、該規則に基づいて上記合成音の韻律情報を生成することを特徴とする音声合成装置を提供する。
【0009】
本発明によれば、文意の種類に応じて韻律情報を生成するため、入力文の文意に応じた韻律で入力文を読み上げることができる。
【0010】
また、本発明は、上記生成する手段は、文意の種類に対応する辞書を選択し、該辞書に基づいて上記入力文の言語解析を行うことを特徴とする音声合成装置を提供する。
【0011】
本発明によれば、文意の種類に対応する辞書が優先して使用されるため、入力文の文意に応じたより自然な読み上げが可能である。
【0012】
また、本発明は、上記検出された特徴に基づいて上記入力文の区切り位置を決定する手段をさらに有し、上記生成する手段は、上記区切り位置に基づいて上記合成音を生成することを特徴とする音声合成装置を提供する。
【0013】
本発明によれば、入力文のフォーマットの特徴から適切な区切り位置を決定して合成音を生成するため、入力文を滑らかに読み上げることができる。
【0014】
また、本発明は、上記入力文が電子メールの文章であって、各行の文字数の差分が所定値以下である場合に、上記決定する手段は、上記入力文の各行の改行コードが存在する位置では入力文を区切らないように決定することを特徴とする音声合成装置を提供する。
【0015】
本発明によれば、文章の言語解析を行う場合、通常、改行コードの位置で文章を区切ることが多いが、電子メールの文章にバラツキが少ない場合、すなわち、各行の文字数が略同一である場合は、各行の文字数を合わせるためにユーザが強制的に改行を入力していると判断し、各行の改行コードの位置では文章を区切らないように決定することにより、不自然な文章の途切れを防止し、入力文を滑らかに読み上げることができる。
【0016】
【発明の実施の形態】
(実施の形態1)
図1は、本発明に係る音声合成装置の一形態を示す機能ブロック図である。17は本実施の形態に係る音声合成装置である。
【0017】
図1中のテキストは、音声合成装置17に入力される文字情報のことであり、例えば、ASCIIコードやJISコード等の所謂文字コードで示されるデータ列や文字寄せなどを示す位置情報などのことである。本実施の形態では、音声合成装置17は汎用のパーソナルコンピュータに内蔵され、電子メールやWebページあるいは電子ファイル形式の文書などのテキストを音声合成して出力する場合について説明を行うが、本発明はこれに限定されるものではなく、入力されたテキストに対して音声合成を行うような装置全般に対して適用可能である。
【0018】
図1に基づいて、テキストが入力されてから合成音を出力するまでの音声合成装置17における処理の流れを説明する。
【0019】
音声合成装置17に入力されたテキストは、言語解析部2において、周知の形態素解析や辞書引き等によりテキストの言語解析が行われ、音声合成に必要な読みや韻律などの情報がテキストに付与される。次に、韻律情報生成部3において、言語解析部2から出力される読みや韻律などの情報から韻律情報が生成され、音声合成部4において音声が合成され、出力部5から合成音が出力される。
【0020】
一方、音声合成装置17に入力されたテキストは、上述のように言語解析部2に入力されると共に、フォーマット解析部1にも入力され、テキストに対応する文字情報が読み込まれる。その後、読み込まれた文字情報が、入力文のフォーマットの特徴を特定する予め定められた規則と一致するか否かが判定され、一致する場合にその一致した規則に対応するフォーマットの特徴が検出される。そして、その検出されたフォーマットの特徴に基づいてテキストの文意の種類が判断され、文意の種類を示す情報が出力される。ここで、入力テキストのフォーマットの特徴とは、そのテキストに含まれる箇条書きがあるか否か、文字寄せがあるか否か、段落があるか否か、各行の文字数のバラツキ度合い、漢字の占める割合、記号の占める割合、引用部があるか否か、文末記号の種類、強調文字があるか否かなどのことである。また、文意の種類とは、そのテキストの内容がニュース記事であるとか、レポート文であるとか、通達文であるとか、くだけた文章であるとか、形式ばった文章であるとかのことを意味する。
【0021】
そして、フォーマット解析部1において解析されたテキストの文意の種類を示す情報は、言語解析部2、韻律情報生成部3、音声合成部4に出力され、それぞれにおいて、文意の種類に応じた制御が成され、合成音が生成される。なお、文意の種類に応じて合成音を生成する具体的な例については、実施の形態2〜実施の形態4において説明する。
【0022】
また、フォーマット解析部1では、検出された入力テキストのフォーマットの特徴に基づいて入力テキストの区切り位置が決定され、その区切り位置を示す情報はテキストの特徴を示す情報と共に言語解析部2に出力される。なお、区切り位置に基づいて合成音を生成する具体的な例については、実施の形態5において説明する。
【0023】
なお、図1において、フォーマット解析部1から出ている点線は、入力テキストのフォーマットの特徴に基づいて生成される情報が、言語解析部2又は韻律情報生成部3又は音声合成部4又はそれらの組み合わせに対して出力されることを示している。
【0024】
図2は、フォーマット解析部1の詳細な機能ブロック図である。フォーマット解析部1では、入力されたテキストに対応する文字情報を読み込み(図示せず)、特徴検出部15でその文字情報が、入力文のフォーマットの特徴を特定する予め定められた規則と一致するか否かを判定し、一致する場合にその一致した規則に対応する特徴が検出される。そして、フォーマット分類部16において、その特徴に基づいて、そのテキストの文意の種類が判断され、文意の種類を示す情報が出力される。
【0025】
特徴検出部15は、箇条書検出部6、文字寄せ検出部7、段落検出部8、文字数バラツキ検出部9、漢字出現率算出部10、記号出現率算出部11、引用部検出部12、文末記号検出部13、強調文字検出部14で構成されており、各部ではそれぞれ、入力テキストの文字情報からフォーマットの特徴を検出するための規則が予め設定されている。なお、特徴検出部15は、上記各部の全部で構成される必要はなく、その一部で構成されていても良い。
【0026】
次に、特徴検出部15の各部におけるフォーマットの特徴を検出するための規則について説明する。
【0027】
箇条書検出部6では、テキストに箇条書きがあるか否かを検出する。箇条書きの検出は例えば次のようにして行われる。すなわち、複数行の先頭文字が同じ記号である場合(図3における記号「・」)、複数行の先頭文字が数字であり、かつ、その各数字の並びが続き番号になっている場合(図4)、複数行の先頭文字が同じ記号であり、かつ、先頭文字の次の文字が数字であり、かつ、その各数字の並びが続き番号になっている場合(図5)、複数行の先頭文字列が均等割付されており、かつ、その直後に同じ数の空白になっている場合(図6)などである。なお、図3〜図6に示す上記例においては、箇条書を示す複数行の各行が1行単位で示されているが、各行がそれぞれ複数行になっていても良い。また、図6における均等割付された文字列の直後は空白ではなく、例えば「:」などの記号であっても良い。
【0028】
文字寄せ検出部7では、各行の文字列が、右寄せ、左寄せ、又は中央寄せなどの所謂文字寄せがあるかどうか、又は、その文字寄せされた文字列が均等割付されているかどうかを検出する。文字寄せの検出は、例えば、入力テキストの文字情報中の文字寄せを示す位置情報に基づいて行われる。
【0029】
段落検出部8では、テキスト中に段落が存在するかどうかを検出する。段落は、文章と文章との間に空白行が挿入されている場合に段落ありと判断される。
【0030】
文字数バラツキ検出部9では、各行の文字数をカウントして、各行の文字数のバラツキを検出する。各行の文字数が略同一である場合はバラツキ度合いは低いと判断される。逆に各行の文字数が大きく異なる場合はバラツキ度合いは高いと判断される。すなわち、各行の文字数の差分を取り、その差分値が所定値以下ならばバラツキ度合いは低いと判断され、所定値以上ならばバラツキ度合いは高いと判断される。
【0031】
漢字出現率算出部10では、テキストの全文中から漢字を抽出し、全文字数に占める漢字の数で表される漢字出現率を算出する。漢字の抽出は、ひらがな、カタカナ、数字、記号以外の文字を漢字とみなして行う。
【0032】
記号出現率算出部11では、テキストの全文中から記号を抽出し、全文字数に占める記号の数で表される記号出現率を算出する。
【0033】
引用部検出部12では、電子メール文の引用部を検出する。引用部の検出は、各行の先頭文字が、例えば「>」などの予め設定された引用記号であるかどうかで判断される。
【0034】
文末記号検出部13では、各行の最終文字が句点記号であるか、又はそれ以外の記号であるかを検出する。文末記号の検出は、各行の最終文字が、例えば、「!」や「?」や「…」などの予め設定された句点以外の記号であるかどうかで判断される。
【0035】
強調文字検出部14では、テキスト中に強調文字があるかどうかを検出する。強調文字の検出は、テキスト中の文字に下線や太字などが付加されているかどうかで判断される。
【0036】
上述のように、特徴検出部15では、読み込まれた文字情報中の文字コードに基づいて入力テキストのフォーマットに関する特徴を検出する。すわなち、例えば、箇条書検出部6において、読み込まれた文字情報中に、予め箇条書検出部6で定められた規則である複数行の先頭文字が同じ記号であるという文字コードパターンを含む場合、その入力テキストのフォーマットの特徴は、箇条書きがあるという特徴であると特定し、その情報を検出する。
【0037】
また、特徴検出部15では、読み込まれた文字情報中の位置情報に基づいて入力テキストのフォーマットに関する特徴を検出する。すわなち、例えば、文字寄せ検出部7において、読み込まれた文字情報中に、右寄せがあるという位置情報を含む場合、その入力テキストのフォーマットの特徴は、右寄せがあるという特徴であると特定し、その情報を検出する。
【0038】
なお、上述の特徴検出部15の各部における入力テキストの各文字の検出は、例えば「>」文字を検出するにはそれに対応した文字コードを検出すればよく、これらの処理は周知のソフトウエア技術で行うことができる。
【0039】
フォーマット分類部16では、特徴検出部15の各部で検出された結果に基づいて入力テキストを、友人同士でやり取りされる手紙(電子メール)などのくだけた文章、強調文字や文字寄せなどを利用して開催日程などを知らせる通達文や箇条書きを多用するレポート文などの形式ばった文章、ニュース記事などのように文意の種類を判断して分類し、その文意の種類を示す情報を出力する。上記の分類は、例えば、入力されたテキストに、箇条書きと文字寄せと段落があり、各段落内の文字数にバラツキがない場合は、フォーマットが形式ばっていることから通達文であると判断するといったように、経験則からその分類する条件を設定すればよい。例として、入力テキストが電子メールの場合におけるフォーマット分類部16の処理を示すフローチャートを図7に示す。
【0040】
図7を参照してフォーマット分類部16の処理を説明すると次のようになる。引用部検出部12で引用部が検出されている場合は、友人同士でメールのやり取りをしている確立が高いと判断して、そのテキストはくだけた文章に分類される(S201)。S201で引用部がないとされ、段落検出部8で段落が検出されていない場合も、友人同士でメールのやり取りをしている確立が高いと判断して、そのテキストはくだけた文章に分類される(S202)。S202で段落が検出されており、漢字出現率算出部10で算出された値が所定値(K%)以下の場合も、漢字の使用頻度が低いため、友人同士でメールのやり取りをしている確立が高いと判断して、そのテキストはくだけた文章に分類される(S203)。S203で所定値(K%)以上であり、記号出現率が所定値(Y%)より大きい場合は、そのテキストはニュース記事であると分類される(S204)。S204で所定値(Y%)以下であり、文末記号検出部13で行の最終文字が句点以外の記号、例えば「!」又は「?」である場合は、友人同士でメールのやり取りをしている確立が高いと判断して、そのテキストはくだけた文章に分類される。なお、この場合、テキストの複数行のうち1行でもこの条件を満たせばくだけた文章であると判断してもよいし、複数行のうち所定数以上この条件を満たせばくだけた文章であると判断するようにしてもよい。S205で行の最終文字が句点であり、強調文字検出部14で強調文字が検出されるか、又は、文字寄せ検出部7で文字寄せが検出されている場合は、そのテキストは開催日程などを知らせる比較的レイアウトを重視した通達文に分類される(S206)。S206で強調文字、文字寄せの双方が検出されず、箇条書検出部6で箇条書きが検出されている場合は、そのテキストは形式ばった文章のレポート文に分類される(S207)。S207で箇条書きが検出されない場合は、そのテキストはくだけた文章に分類される。
【0041】
なお、図7の例では、入力テキストの文意の種類を4つに分類したが、例えば、メールなどのくだけた文章とレポート文などの形式ばった文章の2種類に分類したり、さらにそれにニュース記事などのやや形式ばった文章を加えて3種類に分類するといったように、分類する数や種類はこれに限定されるものではない。また、図7の例は、フォーマット分類部16において入力テキストの文意の種類を判断する際の一例を示すものであり、図7のフローチャートで示す全ての条件を使用する必要はなく、その一部だけを使用して判断するようにしても良い。
【0042】
(実施の形態2)
図8は、本発明に係る音声合成装置の別の形態を示す機能ブロック図である。図1と同一の構成要素には同一の符号を付し、同じ説明は省略する。
【0043】
韻律情報生成部3内の韻律生成規則選択部18では、フォーマット解析部1から出力された文意の種類を示す情報に対応した韻律生成規則を選択する。韻律生成規則とは、テキストの種類に応じて予め設定されたピッチ長、ピッチ変動幅、発声速度、ポーズ長などの韻律生成のためのパラメータのことであり、例えば、文意の種類を示す情報がくだけた文章である場合は、ピッチ変動幅は大きく設定されており、抑揚が明確に出るように制御されている。また、文意の種類を示す情報がくだけた文章である場合は比較的簡単な単語を多く含んでいるため聞き取り易いことから、発声速度は速めに設定され、かつ、ポーズ長は短めに設定されており、人間が普通に会話するような速度で読み上げるように制御されている。また、文意の種類を示す情報がレポート文などのように形式ばった文章である場合は、落ち着いたトーンで読み上げるようにピッチ長を設定する。文意の種類を示す情報が通達文などのように箇条書きの多い文章である場合は、聞き取り易いように発声速度は遅めに設定され、ポーズ長は長めに設定される。なお、上述の規則は一例である。また、予めその規則を設定しておくのではなく、ユーザがその規則を自由に設定できるようにしておいても良い。
【0044】
このように、テキストの書式からその文意の種類が分類され、その文意の種類に応じて合成音の韻律情報を生成するため、テキストの文意に応じた韻律でテキストを読み上げることが可能になる。特に、入力テキストが電子メールであり、連続して複数の電子メールを読み上げる場合は、電子メール毎にその内容に応じた韻律で読み上げられることから、文章の内容を韻律から把握することが可能である。
【0045】
(実施の形態3)
図9は、本発明に係る音声合成装置の別の形態を示す機能ブロック図である。図1と同一の構成要素には同一の符号を付し、同じ説明は省略する。
【0046】
言語解析部2内の辞書選択部19では、フォーマット解析部1から出力された文意の種類を示す情報に対応した辞書を選択する。この選択された辞書は言語解析部2で使用される。例えば、文意の種類を示す情報がくだけた文章である場合は、話し言葉用辞書を選択し、言語解析部2においてこの話し言葉用辞書が通常使用される辞書よりも優先して使用されるように制御する。友人間でやり取りされる電子メールの文章は話し言葉で書かれている場合が多いため、話し言葉用辞書を選択することによって、より正しく形態素解析を行うことが可能になる。
【0047】
また、語尾に「○○ですー」や「××なんだ〜」などの話し言葉特有の読み上げ方を特徴付ける記号(この場合、「ー」や「〜」)がある場合には、その記号に適した韻律規則を予め話し言葉用辞書に設定しておくことにより、より話し言葉調に近い韻律を生成することが可能になる。
【0048】
また、箇条書きであると判断された場合には、箇条書きを表す先頭文字(例えば、図3に示す記号「・」)は読み上げないように予め話し言葉用辞書に設定しておくようにしても良い。
【0049】
また、友人間でやり取りされる電子メールの文章などの話し言葉の文章では、例えば「○○を書いてマス。」というように単語の一部をカタカナで書いたりすることがあり、予め話し言葉用辞書にそのようなカタカナはひらがなに直すように設定しておくことにより、言語解析部2において正しい言語解析を行うことができ、より自然な読み上げが可能になる。
【0050】
(実施の形態4)
図10は、本発明に係る音声合成装置の別の形態を示す機能ブロック図である。図1と同一の構成要素には同一の符号を付し、同じ説明は省略する。
【0051】
音声合成部4内の声質選択部20では、フォーマット解析部1から出力された文意の種類を示す情報に対応した声質を選択する。この選択された声質は、合成音声部4で使用される。声質選択部20では、予め複数の声質を用意しておき、例えば、文意の種類を示す情報が通達文やレポート文などの形式ばった文章である場合は低い声にするなど、文意の種類に応じて適切な声質を予め設定しておく。
【0052】
このように、テキストのフォーマットを解析して分類することにより、文章の内容に応じた声質を選択することが可能であり、様々な文章に対して異なる声質で読み上げることが可能である。
【0053】
(実施の形態5)
図11は、本発明に係る音声合成装置の別の形態を示す機能ブロック図である。図1と同一の構成要素には同一の符号を付し、同じ説明は省略する。
【0054】
フォーマット解析部1は、特徴検出部15の各部において検出されたテキストの特徴を示す情報及びそのテキスト中の位置を示す情報を区切り位置決定部21に出力する。つまり、特徴検出部15の箇条書検出部6で箇条書きが検出された場合は、箇条書きが検出されたことを示す情報及びその位置情報が出力され、また、文字寄せ検出部7で文字寄せが検出された場合は、文字寄せが検出されたことを示す情報及びその位置情報が出力される。なお、特徴検出部15の各部で複数の特徴が検出された場合は、その全ての情報を出力するようにしておく。
【0055】
区切り位置決定部21では、テキストの特徴を示す情報及びその位置情報に基づいて言語解析部2で解析されるテキストの文や単語の区切り位置を決定する。
【0056】
まず、文を区切る位置を決定するための文区切り規則の例について説明する。
【0057】
例えば、入力テキストに箇条書きがある場合は、文章の内容はそれぞれの箇条書き毎に区切られているため、その箇条書きの行については改行の位置でその文を区切るように決定すれば、箇条書きのそれぞれの行を滑らかに読み上げることができる。すなわち、区切り位置決定部21は、テキストに箇条書きの特徴があることを示す情報を検出した場合は、言語解析部2に対してその箇条書きの行については改行コードの位置でその文を区切るように命令すれば良い。また、テキストに文字寄せがある場合についても同様に、文字寄せの行とその次の行とは文章の内容が異なるため、区切り位置決定部21は、テキストに文字寄せの特徴を示す情報を検出した場合は、言語解析部2に対してその文字寄せの行については改行コードの位置でその文を区切るように命令する。そうすることにより、箇条書きの行とその次の行とを滑らかに読み上げることが可能になる。
【0058】
また、電子メールなどで、入力テキストの各行の文字数のバラツキが少ない場合は、各行の文字数を合わせて複数行を全体として見やすくするために、ユーザが自ら改行を入力している場合が多いため、その改行では文を区切らないように決定すれば、その行とその次の行とを滑らかに読み上げることができる。すなわち、区切り位置決定部21は、バラツキ度合いが低い場合、つまり各行の文字数の差分が所定値以下であるという特徴を示す情報を検出した場合は、言語解析部2に対してその各行における改行コードを無視してその位置では文を区切らないように命令すれば良い。
【0059】
また、電子メールなどで、入力テキストに段落がある場合は、段落ごとに文章の内容が異なっている場合が多いため、段落中の改行ではその文を区切らないように決定すれば、文章を滑らかに読み上げることができる。すなわち、区切り位置決定部21は、テキストに段落があるという特徴を示す情報を検出した場合は、言語解析部2に対してその段落中の改行コードを無視してその位置では文を区切らないよう命令すれば良い。なお、1つの段落中で極端に文字数が少ない行がある場合は、その位置で文章の内容が変化している可能性が高いため、その行末の改行コードで文を区切るようにしても良い。
【0060】
また、電子メールなどで、入力テキストに引用部がある場合は、相手先からの返信の際にメールサーバなどで強制的に改行コードが挿入された可能性が高いため、引用部中の改行ではその文を区切らないように決定すれば、文章を滑らかに読み上げることができる。すなわち、区切り位置決定部21は、テキストに引用部があるという特徴を示す情報を検出した場合は、言語解析部2に対してその引用部中の改行コードを無視してその位置では文を区切らないように命令すれば良い。
【0061】
上述の文区切り規則の例のように、入力テキストのフォーマットの特徴から文の区切りを決定することにより、句点などの文の区切りを示す記号を検出してその位置で文を区切る場合に比べて、例えば、文章の見出しを記した行において句点がない場合や、誤って文の途中で改行してしまった場合などにおける文の区切りの誤検出を低く抑えることができる。なお、上述の文区切り規則の例に、文の区切りを示す記号による手法を組み合わせて、入力テキストの文の区切りを決定するようにしても良い。
【0062】
次に、文字の間に空白(所謂スペース)がある場合の単語区切り規則について説明する。この単語区切り規則では、文字の間に空白が挿入されている文字列において、その空白を削除して空白の前後の文字を結合するかどうかを決定する。
【0063】
例えば、入力テキストに箇条書きがあり、かつ、文字列の文字寄せが均等割付になっている場合は、均等割付された文字列から空白を削除し、空白の前後の文字を結合する。すなわち、区切り位置決定部21は、テキストに箇条書きがあるという特徴を示す情報及び均等割付があるという特徴を示す情報が含まれている場合は、言語解析部2に対してその空白を削除し、空白の前後の文字を結合するように命令する。こうすることにより、空白によって文字列が区切られること無く、言語解析部2において、その文字列を単語として解析することができる。
【0064】
上述の単語区切り規則の例のように、入力テキストのフォーマットの特徴から単語の区切りを決定することにより、改行の前後又は空白の前後で文章を結合して形態素解析を行う手法に比べて、計算量を低く抑えることができる。
【0065】
なお、上述の実施の形態1〜実施の形態5における音声合成装置の各構成を任意に組み合わせた音声合成装置を提供することも可能である。このように各構成を任意に組み合わせた場合でも、それぞれの実施の形態で説明した同様の作用効果を奏することは明らかである。
【0066】
また、上述の各実施の形態における処理の一部又は全部をコンピュータによる処理に適した命令の順番付けられた列からなるもの(プログラム)として提供することも可能である。また、そのプログラムのインストール、実行、プログラムの流通のために、そのプログラムを記録したコンピュータ読取可能な記録媒体として提供することも可能である。
【0067】
【発明の効果】
本発明によれば、入力テキストのフォーマットの特徴を検出し、その特徴に基づいて音声合成を行うため、入力テキストの文意に応じた適切な読み上げが可能である。
【0068】
さらに、上記箇条書検出部 , 文字寄せ検出部 , 段落検出部 , 文字数バラツキ検出部 , 漢字出現率算出部 , 記号出現率算出部 , 引用部検出部 , 文末記号検出部および強調文字検出部のうちの少なくとも何れか一つによって上記入力文のフォーマットの特徴を検出し、上記箇条書検出部 , 文字寄せ検出部 , 段落検出部 , 文字数バラツキ検出部 , 漢字出現率算出部 , 記号出現率算出部 , 引用部検出部 , 文末記号検出部および強調文字検出部のうちの少なくとも何れか一つによる検出結果又は算出結果に従って、上記入力文の文意の種類がくだけた文章 , 通達文 , レポート文およびニュース記事のうちの何れであるかを判断するため、入力文の文意の種類を的確に判断することが可能である。
【0069】
また、本発明によれば、入力テキストのフォーマットの特徴から適切な区切り位置を決定して合成音を生成するため、入力テキストを滑らかに読み上げることが可能である。
【図面の簡単な説明】
【図1】 本発明の実施の形態1における音声合成装置の機能ブロック図である。
【図2】 本発明の実施の形態1におけるフォーマット解析部の機能ブロック図である。
【図3】 本発明の実施の形態1における、箇条書きを有するテキストのフォーマットを示す概略図の第1の例である。
【図4】 本発明の実施の形態1における、箇条書きを有するテキストのフォーマットを示す概略図の第2の例である。
【図5】 本発明の実施の形態1における、箇条書きを有するテキストのフォーマットを示す概略図の第3の例である。
【図6】 本発明の実施の形態1における、箇条書きを有するテキストのフォーマットを示す概略図の第4の例である。
【図7】 本発明の実施の形態1におけるフォーマット解析部のフローチャートである。
【図8】 本発明の実施の形態2における音声合成装置の機能ブロック図である。
【図9】 本発明の実施の形態3における音声合成装置の機能ブロック図である。
【図10】 本発明の実施の形態4における音声合成装置の機能ブロック図である。る。
【図11】 本発明の実施の形態5における音声合成装置の機能ブロック図である。
【符号の説明】
1 フォーマット解析部
2 言語解析部
3 韻律情報生成部
4 音声合成部
17 音声合成装置

Claims (5)

  1. 入力文に対応する合成音を出力する音声合成装置において、
    上記入力文に対応する文字情報を読み込む手段と、
    箇条書検出部 , 文字寄せ検出部 , 段落検出部 , 文字数バラツキ検出部 , 漢字出現率算出部 , 記号出現率算出部 , 引用部検出部 , 文末記号検出部および強調文字検出部のうちの少なくとも何れか一つを含むと共に、上記読み込まれた文字情報中の文字コード又は位置情報に基づいて上記入力文のフォーマットの特徴を検出する手段と、
    上記箇条書検出部 , 文字寄せ検出部 , 段落検出部 , 文字数バラツキ検出部 , 漢字出現率算出部 , 記号出現率算出部 , 引用部検出部 , 文末記号検出部および強調文字検出部のうちの少なくとも何れか一つによる検出結果又は算出結果に従って、上記入力文の文意の種類がくだけた文章 , 通達文 , レポート文およびニュース記事のうちの何れであるかを判断する手段と、
    上記文意の種類に応じて上記合成音を生成する手段と、
    を有することを特徴とする音声合成装置。
  2. 上記生成する手段は、文意の種類に対応する韻律生成規則を選択し、該規則に基づいて上記合成音の韻律情報を生成することを特徴とする請求項1に記載の音声合成装置。
  3. 記生成する手段は、文意の種類に対応する辞書を選択し、該辞書に基づいて上記入力文の言語解析を行うことを特徴とする請求項1に記載の音声合成装置。
  4. 上記検出されたフォーマットの特徴に基づいて上記入力文の区切り位置を決定する手段をさらに有し、
    上記生成する手段は、上記区切り位置に基づいて上記合成音を生成する
    ことを特徴とする請求項1に記載の音声合成装置。
  5. 上記入力文が電子メールの文章であって、各行の文字数の差分が所定値以下である場合に、上記決定する手段は、上記入力文の各行の改行コードが存在する位置では入力文を区切らないように決定することを特徴とする請求項4に記載の音声合成装置。
JP2001003395A 2001-01-11 2001-01-11 音声合成装置 Expired - Fee Related JP3648456B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001003395A JP3648456B2 (ja) 2001-01-11 2001-01-11 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001003395A JP3648456B2 (ja) 2001-01-11 2001-01-11 音声合成装置

Publications (2)

Publication Number Publication Date
JP2002207494A JP2002207494A (ja) 2002-07-26
JP3648456B2 true JP3648456B2 (ja) 2005-05-18

Family

ID=18871742

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001003395A Expired - Fee Related JP3648456B2 (ja) 2001-01-11 2001-01-11 音声合成装置

Country Status (1)

Country Link
JP (1) JP3648456B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4765274B2 (ja) * 2004-07-08 2011-09-07 ソニー株式会社 音声合成装置及び音声合成方法
JP5862998B2 (ja) * 2011-04-21 2016-02-16 いすゞ自動車株式会社 車両用表示装置
JP2016045637A (ja) * 2014-08-21 2016-04-04 富士ゼロックス株式会社 文書処理装置及びプログラム。
JP6441177B2 (ja) * 2015-07-29 2018-12-19 日本電信電話株式会社 ポーズ長決定装置、ポーズ長決定方法、およびプログラム

Also Published As

Publication number Publication date
JP2002207494A (ja) 2002-07-26

Similar Documents

Publication Publication Date Title
CA2397985C (en) Apparatus and method for context-based highlighting of an electronic document
EP1345394B1 (en) Voice message processing system and method
US10535042B2 (en) Methods of offering guidance on common language usage utilizing a hashing function consisting of a hash triplet
JP5231698B2 (ja) 日本語の表意文字の読み方を予測する方法
Audichya et al. Computational linguistic prosody rule-based unified technique for automatic metadata generation for Hindi poetry
JP5056337B2 (ja) 情報検索システム
JP3648456B2 (ja) 音声合成装置
US20230069113A1 (en) Text Summarization Method and Text Summarization System
JPH10133853A (ja) 電子メール書換え方法及び装置
KR102182248B1 (ko) 문법 검사 시스템 및 방법과 이를 위한 컴퓨터 프로그램
US20170270949A1 (en) Summary generating device, summary generating method, and computer program product
KR20040028038A (ko) 자연언어처리 기술을 이용한 텍스트-이미지 변환 시스템및 그 방법
JP6619932B2 (ja) 形態素解析装置およびプログラム
JP2002055973A (ja) 情報処理装置、媒体、およびプログラム
JPWO2009041661A1 (ja) 情報処理装置、及びプログラム
JP5169602B2 (ja) 形態素解析装置、形態素解析方法及びコンピュータプログラム
JP4073459B2 (ja) 文解析装置
Rodrigues et al. Arabic data science toolkit: An api for arabic language feature extraction
JP2003005776A (ja) 音声合成装置
JP2001282815A (ja) 要約読み上げ装置
Christal et al. Authorship Profiling of Instant Messaging Sites based on Stylistic and Stylometric Analysis
Kawasaki A Stylometric Analysis of Amadís de Gaula and Sergas de Esplandián
Singh et al. A Proposed Approach for Identifying the Connotative Relationship of English Sentences and paragraphs using the NLP package of Python
Kappagoda The Use of Systemic-Functional Linguistics in Automated Text Mining.
JP2011113099A (ja) 未知語を含む文章を修正するための文章修正プログラム、方法及び文章解析サーバ

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040409

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040420

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040618

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20040618

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20040618

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040921

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041119

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20041228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050208

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050214

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080218

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090218

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100218

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees