WO2001033549A1

WO2001033549A1 - Dispositif et procede de lecture de messages electroniques, et support enregistre de conversion de texte

Info

Publication number: WO2001033549A1
Application number: PCT/JP2000/007652
Authority: WO
Inventors: Katsuyoshi Yamagami; Takahiro Kamai; Yumiko Kato
Original assignee: Matsushita Electric Industrial Co., Ltd.
Priority date: 1999-11-01
Filing date: 2000-10-30
Publication date: 2001-05-10

Description

明細電子メール読み上げ装置および方法およびテキス卜変換処理用記録媒体技術分野

本発明は、電子メールなどの電子化テキス卜を合成音声で読み上げる電子メール読み上げ装置および方法、およびテキスト変換規則テーブルを格納した記録媒体に関する。背景技術

電子メールの普及に伴い，電話から電子メールの内容を確認する機能や、視覚障害者向けに電子メールを読み上げる機能などが求められている. その要求に対応するために、電子メールの内容を電話から確認する機能を有する C T I ( Computer Telephony Integration) サーバや、目の見えにくい高齢者や視覚障害者が電子メールの内容を音声で確認できる電子メール読み上げソフ卜ウェアなどが実用化されている。

これら、 C T Iサーバ、読み上げソフトウェアにおいては、電子メ一ルのテキストを読み上げるために、テキス卜を音声に変換するテキスト音声合成技術が用いられている。

電子メールのテキストフォ一マットは大きく分けて、電子メールの送受信に関する各種情報が格納されたヘッダ部分と、実際に送信者がテキストを記述した本文部分の 2つに分けることができる。ヘッダ部分には、発信者アドレス、宛先アドレス、送信日時などの各種ヘッダ情報が含まれており、通常これらの文字列は、読み上げても意味をなさないアルフアベッ卜列であることが多い。

このように、電子メールのテキストを読み上げる場合には、読み上げる必要がある部分と必要ではない部分を切り分ける処理が必要であるが、ヘッダ部と本文部については、明確に規格化がなされているため、容易に切り分けることが可能で、従来の電子メール読み上げ機能でも、本文だけを読み上げることが可能である。

さらに、電子メール本文についても、各行の改行位置が単語の途中であったり、 1行の途中に句点があるなど、読み上げた音声が意味をなすように 1文単位で読み上げるためには考慮すべき点がある。従来の電子メール読み上げ機能では、句点、疑問符、その他の記号を区切り文字として、 1文単位のテキストに分割するなどして、 1文単位での読み上げの開始位置と終了位置が適切になるようにしている。

また、特開平 9 - 2 5 1 3 7 3号公報には、電子メールを送信しょうとするユーザが、入力文のうち音声合成を希望する部分については行頭に音声化コマンド（例えば、 ¥speech) を挿入したり、音声合成を希望しない部分については行頭に音声化不可コマンド（例えば、 ¥mute) を挿入して電子メールを送信し、受信側のコマンド認識処理部でその音声化コマンドまたは音声化不可コマンドを認識して、音声合成を行うか否かを選択するものが開示されている。

また、特開平 9 一 1 3 5 2 6 4号公報には、複数のユーザ端末が接続されたメール通信ネットワーク上に、読み '韻律付与ルールを備えたテキスト変換サーバ、およびユーザ指定により音声出力デバイスとなる音声出力サーバを備え、ユーザ端末には、ユーザ各個人が音声出力のための情報を設定する音声出力設定ファイルが接続され、到着した電子メールがファイルの設定条件に合致すると、テキスト変換サーバを介して電子メールに読み ·韻律情報を付与し、メール読み上げコマンドの実行により、音声出力サーバまたは特定のユーザ端末に接続された音声合成装置を用いて音声出力するものが開示されている。【発明が解決しょうとする課題】

しかしながら、従来の電子メール読み上げ機能では、電子メールテキス卜の本文部分を読み上げる上で、次のような問題を有している。

相手からの返信メールや、複数人で交換したメールには、過去にやりとりされたメールの内容の全部、あるいは、一部が引用された部分が含まれる場合がある。引用された部分の先頭には、たとえば '〉' のような引用部分であることを示す記号（引用記号）が挿入されていることが多く、従来の電子メール読み上げ機能では、この引用記号を通常の電子メール中のテキストと判断して、正しく 1文単位にテキストを分割できないという問題がある。

また、引用部分については、冗長となるため読み飛ばすなどの動作が望ましいが、そのような読み上げに関する制御ができないなどの問題もある。

引用部分を読み上げる場合には、電子メールテキスト上では、引用記号によって引用部分が示され、視覚的に構造化されているので、引用部分とそうでない部分は容易に区別できるが、メールテキス卜の最初から読み上げる場合、引用部分とそうでない部分を同じ音声で読み上げると両者を区別できないという問題がある。

また、電子メールのテキストは、目で見て読むことを前提として書かれているので、文字通り読んでも意味がわかりにくい、あるいは、意味をなさない表現が含まれていることがある。たとえば、日付をあらわすのに、 ' 4Ζ6 '、 ' 9 9Ζ 1 2ノ 1 9 ' という書き方をしたり、時刻を表すのに ' 1 2 ： 00 '、 ' 1 3 : 45 ' などという書き方をすることがよくある。その場合、従来の電子メール読み上げ機能では、 ' 4/ 6 'を 'ョンロク、 ' 9 9Z 1 2Z 1 9 をキュージュ一十ユージュ一ニジュ一キュー，、 ' 1 2 ： 0 0 ' を 'ジユー二ゼロ'、 ' 1 3 ： 4 5 ' を 'ジユーサンヨンジュ一ゴ' などと読み上げてしまうため、読み上げ音声が理解困難なものとなるという問題がある。

さらに、電子メールのヘッダ以外の部分においても、アルフアベット、数字、記号からなる電子メールァドレスやホームページアドレスなど、読み上げても意味をなさない文字列が電子メールテキス卜に含まれる場合がある。従来の電子メール読み上げ機能では、こうした部分をアルファベット読み、あるいは、ローマ字読みとしてしまうため、読み上げ音声が分かりづらくなるという問題を有している。

また、数字に関しては、金額や数量をあらわす数字は、桁読みし、電話番号や郵便番号は、桁読みしない（棒読みする）などの切り替えが必要であるが、従来の電子メール読み上げ機能では、切り替えがなされず、数字の部分の読み上げ音声が紛らわしく分かりづらいという問題を有している。発明の開示

本発明は、上記の問題点に鑑みてなされたものであり、その目的は、読み上げに適さない表現を読み上げに適した表現に変換するとともに、その変換部分を聞き手が明確に認識でき、また冗長な引用部分は音声合成しないという効果的および効率的な電子メール読み上げ装置および方法を提供し、またかかる音声合成に適したテキスト変換規則テーブルを格納した記録媒体を提供することにある。

前記の目的を達成するため、本発明に係る電子メール読み上げ装置は、引用記号を含む読み上げに適さない書式の入力テキストを読み上げに適した書式へと 1文単位に整形するとともに、引用記号による引用部分を 1文単位に整形したテキストの前後に、指定範囲におけるテキストの読み上げの有効 ·無効の制御、読み上げ音声の切り替え、読み上げ速度の変更、および音声合成パラメ一夕の変更を含むコマンドを挿入して出力するテキスト整形部と、テキスト整形手段の出力である 1文単位のテキス卜に対して、文字列の置換方法および置換部分に対する前記コマンドを記述しテキスト変換規則テーブルに登録されたテキスト変換規則に従つて、文字列の置換およびコマンドの挿入を行うテキスト変換部と、コマンドによる指定範囲のテキス卜の読み上げに関して、コマンドの内容に従って、テキスト変換部で置換された 1文単位のテキストを音声化する音声合成部とを備えたことを特徴とする。

この構成によれば、電子メールの引用された部分の引用記号部分を通常の文字列と区別するので、引用部分であっても正しく 1文単位でテキストを読み上げることができる。また、引用部分の読み上げに関して、読み上げない、引用以外の部分と異なる声の種類で読み上げる、または速度を速めて読むなどの制御が可能となり、冗長な引用部分に関しての柔軟な読み上げ機能を実現することができる。さらに、電子メールテキス卜に含まれる文字通りの読み上げに適さないような文字列を読み上げに適した表現へと変換して読み上げることができる。

本発明に係る電子メール読み上げ装置において、テキスト変換規則は、変換前のテキストパターンと、変換後のテキストパターンと、変換されたテキスト部分の読み上げを制御するコマンドとを 1組として成ることが好ましい。

この構成によれば、テキスト変換規則によって変換された部分の読み上げ音声をコマンドによって制御するので、変換された部分であることを明確に聞き手に認識させることができる。また、テキスト変換規則で変換動作は行わず、コマンドだけを挿入することで、電子メールテキストの重要な部分への注意を促すなどの機能を実現することができる。また、テキス卜変換規則は、 ' 9 9 Ζ 1 2 Ζ 1 9 '、 ' 1 2 : 3 0 ' 等の省略された形式で記述された日付および時刻を含む表現を、その記述内容を音声化に適した表現へと変換する規則である。これにより、略記された日付や時刻も、音読する読み方に変換して読むので、理解可能な読み上げ音声とすることができる。

または、テキスト変換規則は、音声化に適さない電子メールアドレスおよびホームページアドレスを含む文字列を、それぞれ、電子メールァドレスおよびホームページァドレスの所有者名を含む文字列へと変換する規則である。これにより、電子メールアドレスやホームページァドレスを文字通り読み上げるのではなく、所有名を含む表現に置き換えて読み上げるので、スムーズで理解しやすい電子メ一ルの読み上げが可能になる。

または、テキスト変換規則は、電話番号および郵便番号を含む数字を棒読みする（桁読みしない）部分の前後に、数字の棒読みを指定するコマンドを挿入する規則である。これにより、棒読みすべき数字を含む文字列のパターンをテキスト変換規則に記述することにより、桁読みすベき数字と、棒読みすべき数字を区別して読み上げることが可能になる。前記の目的を達成するため、本発明に係る電子メール読み上げ方法は、入力された電子メールテキス卜の引用部分を解析し、引用記号を削除して 1文単位の書式に整形するとともに、引用部分の前後にコマンドを挿入し、その後、テキスト変換規則テ一ブルに登録されているテキスト変換規則に従って、読み上げに適さない表現を読み上げに適した表現へと変換するとともに、変換部分の前後にコマンドを挿入し、挿入されたコマンドの指定に従って、読み上げ動作と音声合成パラメ一夕を制御しながら、 1文へと整形された変換後のテキストを合成音声で読み上げることを特徴とする。

この構成によれば、引用部を正しく読み上げることができ、かつ、同部分を読み飛ばしするなどの機能を実現することができる。また、理解しづらい部分を理解しやすい表現に置き換えて、読み上げ方や音声に変化をつけて効果的に分かり易く読みげることができる。

前記の目的を達成するため、本発明に係る記録媒体は、入力されたテキス卜における文字列を変換処理し音声合成するために用いられる記録媒体であって、文字列の変換規則と、音声合成の動作を指定するコマンドとを含むテキスト変換規則が登録されたテキスト変換規則テーブルが格納されたことを特徴とする。

この構成によれば、テキスト変換規則テーブルを参照することで、略記された日付、時間や、本文に含まれる電子メールアドレスやホームべージアドレスなどを、読み上げに適した、あるいは、読み上げても耳障りではない表現に置き換えることができ、かつ、置き換え部分が他の部分と区別できるように、読み上げ音声に変化をつけることが可能になる。図面の簡単な説明

図 1は、本発明の一実施形態による電子メール読み上げ装置の主要構成を示すブロック図である。

図 2は、発明の一実施形態による電子メール読み上げ装置を構築するためのコンピュータシステムの一例を示す図である。

図 3は、本発明の一実施形態による電子メール読み上げ装置の主要動作を説明するためのフローチャートである。

図 4は、本発明の一実施形態による電子メール読み上げ装置に入力される電子メールテキス卜の本文部分の一例を示す図。

図 5は、本発明の一実施形態による電子メール読み上げ装置におけるテキスト整形処理内容の一例を示す図である。

図 6は、本発明の一実施形態による電子メール読み上げ装置におけるテキスト変換規則内容の一例を示す図である。

図 7は、本発明の一実施形態による電子メール読み上げ装置におけるテキスト変換処理内容の一例を示す図である。発明を実施するための最良の形態

以下、本発明の好適な実施形態について、図面を参照して具体的に説明する。

図 1において、電子メール読み上げ装置は、テキスト整形部 1 0 1と、テキス卜変換部 1 0 5と、音声合成部 1 0 8と、音声出力部 1 1 1とからなる。

テキスト整形部 1 0 1は、機能ブロックとして、電子メールテキス卜のヘッダ部分と本文部分を切り離し、本文テキストの取り出しを行う本文テキスト抽出部 1 0 2と、本文テキストの引用部分の書式を解析する引用処理部 1 0 3と、 1行 1文の書式に整形する文単位整形部 1 0 4とを有する。

引用処理部 1 0 3では、 ' > 'などの引用記号によって示される引用部分の開始部分と終了部分を認識し、引用範囲の引用記号を削除する。また、引用部分の前後には、引用部分の読み上げ方法を指定するコマンドの文字列（コマンドタグ）だけの行を挿入する。

文単位整形部 1 0 4では、コマンドタグの行以外を対象に連続するテキストの行を一旦 1行に接続し、 1文の区切りとなる箇所で改行し、 1 文 1行の書式に整形する。その際には、整形前のテキストの各行の前後に挿入されている不要な空白文字なども削除する。

これによつて、引用部分については、正しく 1文単位で読み上げることが可能で、かつ、冗長と思われる引用部分を読まないという効率的な、あるいは、速度を速めて読み上げるなどの効果的な読み上げ機能を実現することができる。

テキスト変換部 1 0 5は、機能ブロックとして、文字列の置き換えと置き換え部分の読み上げ方法を指定するコマンドタグの挿入を行う変換部 1 0 6と、変換部 1 0 6が参照するテキスト変換規則を登録しておくテキスト変換規則テーブル 1 0 7とを有する。

テキスト変換規則テーブル 1 0 7には、文字通り読み上げると意味が通じなくなる表現を、意味が通じる表現へ置き換えるような文字列の置換規則と、読み上げ音声の声の種類や音量などの読み上げ方法を指定するコマンドタグとを組み合わせたものを 1つのテキスト変換規則として記述する。略記された日付、時間や、本文に含まれる電子メールァドレスゃホームページアドレスなどを、読み上げに適した、あるいは、読み上げても耳障りではない表現に置き換えることができ、かつ、置き換え部分が他の部分と区別できるように、読み上げ音声に変化をつけることが可能である。よって、電子メールの内容を分かりやすい音声で聞くことができる。

音声合成部 1 0 8は、機能ブロックとして、入力テキストを解析し、テキストの読みを得て、音声波形を合成する合成処理部 1 0 9と、テキスト整形部 1 0 1と、テキスト変換部 1 0 5から出力されたコマンド夕グを受け取り、読み上げの有無、数字の読み上げ方など読み上げ方法に関する指定、音量などの合成処理に関するパラメ一夕指定などコマンドタグでの指定通りに、合成処理部 1 0 9の動作を制御する合成制御部 1 1 0とを有する。

コマンド文字列により、音声合成部 1 0 8の読み上げモードを詳細に制御することが可能なので、テキスト整形部 1 0 1およびテキスト変換部 1 0 5でのコマンドタグの出力を工夫することにより、電子メールを分かりやすく効果的に読み上げることが可能になる。

音声出力部 1 1 1は、音声合成部 1 0 8で生成された音声信号を出力する。

かかる構成において、電子メールテキストの引用部分を正しく読み、文字通りの読みでは理解できない部分を分かりやすい表現に変換し、数字の桁読み ·棒読みなど読み分けるべき箇所を読み分けて読み、かつ、読み上げ音声に変化をつけて効果的に読み上げることが可能になる。

このような電子メール読み上げ装置は、例えば、図 2に示すようなコンピュー夕システム上に構築されるものである。このコンピュータシステムは、本体部 2 0 1と、キーボード 2 0 2と、ディスプレイ 2 0 3と、入力装置（マウス） 2 0 4と、電子メールの送受信のための通信網 2 0 9とを含む音声出力可能なシステムである。図 1のテキスト変換規則テ一ブル 1 0 7は、本体部 2 0 1にセットされる C D— R O M 2 0 8内、本体部 2 0 1が内蔵するディスク（メモリ） 2 0 5内、あるいは回線 2 0 7で接続された他のシステムのディスク 2 0 6内に格納される。

図 1に示す電子メール読み上げ装置の特徴的な動作をまとめると、図 3のようになる。

すなわち、本文テキスト抽出部 1 0 2で、電子メールの本文部分を抜き出し、引用処理部 1 0 3で、引用部分の書式の解析、引用記号部分の削除、コマンドタグの挿入を行い、文単位整形部 1 0 4で、 1行 1文単位の書式へ整形して出力する（ステップ 3 0 1 )。これにより、引用部分を正しく読み、引用部分の読み上げが制御可能になる。

次に、テキスト変換規則テーブル 1 0 7のテキス卜変換規則を参照しながら、変換処理部 1 0 6でテキスト中の規則に照合する部分を置換すると同時に、コマンドタグの挿入を行う（ステップ 3 0 2 )。これにより音声化に適した表現へ変換し、音声に変化を持たせた効果的な読み上げが可能になる。

次に、合成制御部 1 1 0によって、コマンドタグの指定に従って、読み上げの有無、数字の読み上げ方などの読み上げモードのセット、声の種類、音量などの音声合成パラメ一夕のセットを合成処理部 1 0 9に対して行い、合成処理部 1 0 9は、指定されたモード 'パラメ一夕に従つて 1文単位のテキス卜の合成処理を実行する（ステップ 3 0 3 )。これにより、ステツプ 3 0 1、ステツプ 3 0 2でのコマンドタグの指定通りに、読み上げ動作を制御することが可能になる。

以下、テキスト変換規則の具体例と、それを用いた電子メールテキス卜の整形処理、変換処理、音声合成処理の具体例について、図 4〜図 6 を用いて説明する。

図 4は、テキスト整形部 1 0 1の入力となる電子メールテキス卜の本文部分の一例を示す図である。図 4において、本文部分 4 0 1には、引用記号 '〉' で示された引用部分、 ' 1 0ノ 2 '、 '（土）'、 ' 1 3 ： 0 0 ' などの日時に関する省略した表現、 Eメールアドレス、 U R Lなどの記号を含むアルファベット列、電話番号の表記を含む。

図 5は、テキスト整形部 1 0 1で整形処理したテキス卜の結果の一例を示す図である。図 5において、 5 0 1および 5 0 2は、それぞれ、図 4に示す電子メールの本文部分 4 0 1を整形処理後の例である。

引用部分以外では、 4 0 1において文の途中で改行されている部分が、 1行 1文単位に整形される。 4 0 1において空白である行は、 5 0 1および 5 0 2では削除されている。また、本実施形態においては、コマンドタグは、 ' <コマンド〉'、 'ぐ Zコマンド〉'からなる 1対の組の形式で使用され、 1対のタグで囲まれた範囲で、 'コマンド'が指定する読み上げ動作を有効にすることとする。 5 0 1の例では、本文の最初の '音声 1 ' で指定される種類の音声で読み始め、 'ぐ音声 2 > ' の行から 'ぐ /音声 2 > ' の間は、 '音声 2 ' で指定される '音声 1 ' と区別可能な音声で読み上げ、その後、最後の行までは再び '音声 1 ' で指定される種類の音声で読み上げることになる。

まず、 5 0 1は、引用処理部 1 0 3で、 4 0 1の引用部分「定例ミーティングのお知らせ」、「日時 1 0 Z 2 (土） 1 3 ·· 0 0より」を削除し、本文中のその引用部分があった位置に、音声を変更するコマンドタグぐ音声 2〉、 < Z音声 2 >、およびそのコマンドタグに囲まれた「引用部分は省略します。」という文を挿入する動作とした場合の整形処理結果である。

この整形処理によって、既に過去に交換した電子メールで既知である引用部分を読み上げ対象から外すことで、必要な部分のみが読み上げられるので、引用部分を含む電子メールにおいても必要な部分の内容を効率的に音声で聞くことができる。さらに、本文の読み上げと異なる音声で、「引用部分は省略します。」という内容を読み上げるので、受信した電子メールには引用部分が有るが、読み上げ対象から外れていることをユーザに意識させることができる。

次に、 5 0 2は、引用処理部 1 0 3で、 4 0 1の引用部分の引用記号 '〉' を取り去り、引用部分のテキストの前後に、コマンドタグ <音声 2〉、 <Z音声 2〉と <速度速〉、 <ノ速度速〉、および引用の開始と終了を示す文「引用部分のはじまり。」、「引用部分の終わり。」を挿入する動作とした場合の整形処理結果である。

5 0 2では、引用部分の読み上げ動作としては、 '音声 2 ' で指定される音声によって、引用の開始を示す「引用部分のはじまり。」という文が読み上げられ、引用部分のテキストは '音声 2 ' で指定された音声で、かつ、コマンドタグぐ速度速 >、ぐ Z速度速〉によって、通常よりも速い発声速度で読み上げた後、引用部分の終了を示す「引用部分の終わり。」という文が '音声 2 ' で指定された音声で読み上げられる。

この整形処理によって、引用部分を読み上げの対象とした場合でも、引用部分の音声を変えること、また、引用部分の開始と終了を示す文を読み上げることにより、引用部分とそうでない部分とを明確に区別して聞くことができる。さらに、引用部分を他の部分よりも速い速度で読み上げることで、引用部分を含む電子メールを効率的な音声で聞くことができる。

図 6は、テキスト変換規則テーブル 1 0 7に登録されるテキスト変換規則の一例を示す図である。

図 6において、実線で区切られた各欄の破線の上部が、テキスト中の変換対象となる文字列のパターンをあらわす変換前正規表現であり、破線の下部が、変換前正規表現に照合した部分と置き換えるべき文字列を表す変換後文字列である。

変換前正規表現に用いられている記号には、照合すべき文字列自身と、照合の動作を指定する制御文字が含まれている。制御文字の種類と動作、すなわち、正規表現の文法は、 UN I Xなどの O Sで使用可能なテキスト処理コマンド a wkなどで定義されている正規表現の文法に準ずるものとする。

図 6で用いている正規表現に現れる制御文字の動作を以下で簡単に説明する。

1 (S 1 I S 2 S 3) : S 1、 S 2、 S 3のいずれかの文字列と照合

2 [A-B] Aから Bの範囲にある文字と照合

3 [AB C] A、 B、 Cいずれかの文字と照合

44. . ：任意の一文字と照合

5 E 1 * ： E 1の 0回以上の繰り返しと照合 6. E 1 + ： E 1の 1回以上の繰り返しと照合

7. ¥ A ： Aの文字そのものの意味

なお、 7. の規則は、制御文字そのものを照合の対象としたい場合に使用される。

例えば、 6 0 1の変換前正規表現は、 ' 3/2 2 ' のような日付の表現と照合する正規表現である。 '（[ 1 一 9] I 1 0 I 1 1 I 1 2)，の部分は、 1から 1 2までの月の数字のいずれかと照合することを意味し、

'([ 1一 9] I [ 1 2 ] [ 0— 9 ] | 3 0 | 3 1 )，は、 1から 3 1までの日の数字のいずれかと照合することを意味する。

変換後文字列には、通常の文字とコマンドタグと、さらに、変換前正規表現の中で '0' でくくられた正規表現の部分と照合した部分の文字列を挿入することを指定する特殊なコマンド文字列を記述するものとする。

次に、 6 0 1の変換後文字列を例に説明する。

6 0 1の変換後文字列の 'ぐ速度遅 >'、 '<Ζ速度遅 >' は、一対のコマンドタグであり、 '¥ η ' は、行の改行を支持する文字列である。 ' ¥ 1 '、 ' ¥ 2 ' は、 6 0 1の変換前正規表現に現れる 2箇所の ' 0 ' で囲まれた範囲と照合する部分をそれぞれ、 '¥ 1 '、 '¥ 2 'の位置に挿入することを表す。すなわち、 ' ¥ 1，は、 '（[ 1一 9 ] I 1 0 I 1 1 I 1 2)' と照合した部分と、 '¥ 2 ' は、 '（[ 1一 9 ] I [ 1 2] [ 0 - 9] I 3 0 I 3 D' と照合した部分と、それぞれ置き換えられる。

6 0 1のテキスト変換規則によれば、テキスト中の ' 3 Ζ 2 2 ' という日付の部分は、

ぐ速度遅 >

3月 2 2曰

< 速度遅 > という文字列とコマンドタグに置き換えられることになる。

同様に、 6 0 2は曜日の表記の変換、 6 0 3は時刻の表記の変換、 6 0 4、 6 0 5は電子メールアドレスの変換、 6 0 6は電話番号の変換を行うテキス卜変換規則である。

図 7は、これらのテキスト変換規則によって、図 5の整形処理後テキスト 5 0 1を変換した例を示す図である。

図 7において、図 5の 5 0 1における ' 1 0Z2 ' という日付の部分が、 6 0 1の変換規則によって、 ' 1 0月 2日 ' に変換されており、前後にコマンドタグが挿入されている。 '（土）' という曜日の部分が、 6 0 2 の変換規則によって、 '土曜日 ' に変換されている。 ' 1 2 : 0 0 ' という時刻の部分は、 6 0 3の変換規則によって、 ' 1 2時' に変換されており、前後にコマンドタグが挿入されている。

このように、文字通りに読み上げたのでは意味が通じない表現も、耳で聞いて理解可能な表現に変換して、分かりやすい読み上げが可能になる。また、読み上げの速度を制御するコマンドタグによって、日付、曜日、時刻など確実に聞き取りたい箇所をゆつくりと読み上げることが可能になる。

また、図 5の 5 0 1における 'hanako@provider.ne.jp' という電子メールアドレスの部分は、 6 0 4の変換規則によって、 '花子さんのメ一ルアドレス' という文字列に置き換えられており、電子メールアドレスが文中に現れる場合も違和感無く読み上げることができる。

また、図 5の 5 0 1における 'taro@subdomain.ne.jp' という電子メ

—ルァドレスの部分は、 6 0 5の変換規則により、 ' Eメールァドレス表示' に置き換えられて、前後にコマンドタグが挿入されている。

6 0 4の変換規則では、よく電子メールを受け取る人の電子メールァドレスを、その所有者の名前を含む表現に変換して、誰のメールァドレスかが分かるように読み上げることを意図しており、 6 0 5の変換規則では、 6 0 4のように個人名として登録していない電子メールァドレスの場合の変換動作を意図している。このように、電子メール読み上げ装置のユーザの好みによって、読み上げ動作を切り替えるようなテキスト変換規則を記述することも可能であり、カスタマイズ性の高い読み上げ機能を実現することができる。

さらに、図 5の 5 0 1における ' 0 3— 1 2 3 4— 5 6 7 8 ' という電話番号の部分は、変換規則 6 0 6によって、 ' 0 3の 1 2 3 4の 5 6 7 8 ' という文字列に変換され、かつ、前後にぐ速度遅 > < Z速度遅 >、ぐ数字読み > < 数字読み〉というコマンドタグが挿入されている。コマンドタグぐ数字読み〉、 < /数字読み〉は、その間にある数字の読み方を、位をつけて読むという「桁読み」の読み方ではなく、数字の連続として読むという「数字読み」（「棒読み」）とすることを意味する。よって、電話番号の数字列などを、日付などの桁読みする箇所と区別して、適切な読み方で読み上げることができる。なお、日付、曜日、時刻の変換規則の効果と同様に、読み上げる速度を遅くして確実に電話番号を聞き取ることができるように読み上げることも可能になる。

以上説明したように、本実施形態によれば、引用記号などを含む引用部分を正しく読み上げることができ、かつ、引用部分の読み上げ方法を柔軟に指定することができる。また、文字通りの読み上げでは分かりにくい部分を、理解可能な表現に置き換えて、読み上げ方や音声に変化を持たせて効果的に読み上げることができる。さらに、数字列に関しては、桁読みすべき箇所と数字読みすべき箇所とを区別して、適切に読み分けることができる。

すなわち、テキストの整形処理、テキストの変換処理、コマンドタグによる音声合成の制御を組み合わせることにより、従来の電子メール読み上げ装置に比べ、電子メールテキストを耳で聞いて分かりやすい音声で読み上げることができる。

なお、本実施形態におけるテキスト整形処理の例では、引用部分の開始と終了を示す文を挿入したが、これに代えて、何らかの報知音を出力する、あるいは、単純に数秒間ポーズを入れるなどの処理とすることでもよい。

また、本実施形態におけるテキスト変換処理の例では、コマンドタグによる読み上げ動作の制御として、音声の種類の切り替え制御、読み上げの速度の制御、および数字の読み方の制御を組み合わせた例を示したが、その他の読み上げ方法の制御を組み合わせてもよい。例えば、音量の大小の制御や声の高さの制御を組み合わせることもできる。

Claims

請求の範囲

1 . 引用記号を含む読み上げに適さない書式の入力テキストを読み上げに適した書式へと 1文単位に整形するとともに、前記引用記号による引用部分を 1文単位に整形したテキストの前後に、指定範囲におけるテキストの読み上げの有効 ·無効の制御、読み上げ音声の切り替え、読み上げ速度の変更、および音声合成パラメ一夕の変更を含むコマンドを揷入して出力するテキスト整形部と、

前記テキスト整形手段の出力である 1文単位のテキストに対して、文字列の置換方法および置換部分に対する前記コマンドを記述しテキスト変換規則テーブルに登録されたテキスト変換規則に従って、文字列の置換および前記コマンドの挿入を行うテキスト変換部と、

前記コマンドによる指定範囲のテキストの読み上げに関して、前記コマンドの内容に従って、前記テキスト変換部で置換された 1文単位のテキス卜を音声化する音声合成部とを備えたことを特徴とする電子メール読み上げ装置。

2 . 前記テキスト変換規則は、変換前のテキストパターンと、変換後のテキストパターンと、変換されたテキスト部分の読み上げを制御する前記コマンドとを 1組として成ることを特徴とする請求項 1記載の電子メール読み上げ装置。

3 . 前記テキスト変換規則は、省略された形式で記述された日付および時刻を含む表現を、その記述内容を音声化するのに適した表現へと変換する規則であることを特徴とする請求項 1または 2記載の電子メール読み上げ装置。

4 . 前記テキスト変換規則は、音声化に適さない電子メールアドレスおよびホームページアドレスを含む文字列を、それぞれ、電子メールァドレスおよびホームページァドレスの所有者名を含む文字列へと変換する規則であることを特徴とする請求項 1または 2記載の電子メール読み上げ装置。

5 . 前記テキスト変換規則は、電話番号および郵便番号を含む数字を棒読みする（桁読みしない）部分の前後に、数字の棒読みを指定するコマンドを挿入する規則であることを特徴とする請求項 1 または 2記載の電子メール読み上げ装置。

6 . 入力された電子メールテキストの引用部分を解析し、引用記号を削除して 1文単位の書式に整形するとともに、引用部分の前後にコマンドを挿入し、その後、テキスト変換規則テーブルに登録されているテキス卜変換規則に従って、読み上げに適さない表現を読み上げに適した表現へと変換するとともに、変換部分の前後にコマンドを挿入し、挿入されたコマンドの指定に従って、読み上げ動作と音声合成パラメ一夕を制御しながら、 1文へと整形された変換後のテキストを合成音声で読み上げることを特徴とする電子メール読み上げ方法。

7 . 入力されたテキス卜における文字列を変換処理し音声合成するために用いられる記録媒体であって、前記文字列の変換規則と、音声合成の動作を指定するコマンドとを含むテキスト変換規則が登録されたテキスト変換規則テーブルが格納されたことを特徴とする記録媒体。