JP3224760B2

JP3224760B2 - 音声メールシステム、音声合成装置およびこれらの方法

Info

Publication number: JP3224760B2
Application number: JP18469197A
Authority: JP
Inventors: 下七郎宮; 藤隆斎
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1997-07-10
Filing date: 1997-07-10
Publication date: 2001-11-05
Anticipated expiration: 2017-07-10
Also published as: US6289085B1; JPH1138996A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、電子メールのテキスト
の内容を、例えば、電子メールを送信した人それぞれに
固有の音質の音声で読み上げる音声メールシステム、音
声合成装置およびこれらの方法に関する。

【０００２】

【従来の技術】電子メールのテキストの内容を音声出力
する音声メールシステムが用いられている。かかる音声
メールシステムとして、例えば、特開平５−２６００８
２号公報（文献１）は、受信側端末が、送信元の識別子
（ＩＤ）に対応付けられた母音の音素を用いてテキスト
を音声出力する第１のテキスト読み上げ装置と、送信側
端末が、電子メールに、パラメータを含めて送信し、受
信側端末が、受信したパラメータを用いてテキストを音
声出力する第２のテキスト読み上げ装置とを開示する。

【０００３】しかしながら、文献１に開示された第１の
テキスト読み上げ装置は、端末装置それぞれにおいて音
声素片と送信側ＩＤとを対応付けて登録する必要がある
ので、音声素片の設定に手間がかかり、しかも、一旦、
各端末に音声素片を設定すると、その変更は難しい。ま
た、第１のテキスト読み上げ装置は、電子メールの送信
元ＩＤに応じて母音のみの音声素片を選択し、テキスト
の音声出力を行うので、子音を含めた形で、電子メール
を送信したユーザーそれぞれに固有な音質でテキストを
音声出力することはできない。

【０００４】また、第１のテキスト読み上げ装置は、１
つの音声素片に対して、送信元ＩＤを１つだけしか対応
付けることができないので、例えば、複数のＩＤを有す
る電子メールを送信したユーザーが、いずれのＩＤを用
いた場合にも、テキストを同一の音質で音声出力させよ
うとすると、各端末装置に、同一内容の音声素片を複数
ずつ、送信元ＩＤのみを変更して登録する必要があり、
端末装置の資源が無駄になり、登録可能な音声素片の数
が少なくなってしまう。

【０００５】また、文献１に開示された第２のテキスト
読み上げ装置は、送信側端末が、電子メールそれぞれ
に、電子メールを送信したユーザーの母音の音声素片お
よび声のピッチ等を示すデータを含めて送信するので、
電子メールのデータ量が増大し、通信ネットワークに輻
輳を生じさせる可能性がある。

【０００６】また、音質データをネットワーク内の各端
末に一旦、広めてしまうと、その利用の制限がしずら
く、第３者により勝手に使用されて音質データの作成者
に不利が生じることがある。

【０００７】また、例えば、顧客の端末装置にカジュア
ルな調子の音質データが記憶されている可能性がある場
合に、顧客に対してメールがカジュアルな調子で音声出
力されるという不適切な事態の発生を防ぐといったよう
に、音質データの使用可能範囲を制限したい場合があ
る。

【０００８】

【発明が解決しようとする課題】本発明は、上述した従
来技術の問題点に鑑みてなされたものであり、電子メー
ルの音声出力の際の音質の設定が容易で、しかも、電子
メールを送信したユーザーそれぞれに固有の音質でテキ
ストを音声出力することができる音声メールシステム、
音声合成装置およびこれらの方法を提供することを目的
とする。

【０００９】また、本発明は、電子メールそれぞれに音
声出力の際の音質を示すデータ（音質データ）を付加し
なくとも、電子メールを送信したユーザーそれぞれに固
有の音質でテキストを音声出力することができる音声メ
ールシステム、音声合成装置およびこれらの方法を提供
することを目的とする。また、本発明は、音質データそ
れぞれを、任意の数の送信元ＩＤで共有することがで
き、例えば、同一のユーザーが複数のＩＤを有する場合
であっても、同一の音質データを複数、登録することに
起因する端末装置の資源の無駄使いを防ぐことができ、
多くの音質データを各端末装置に登録することができる
音声メールシステム、音声合成装置およびこれらの方法
を提供することを目的とする。

【００１０】また、本発明は、音質データをネットワー
ク内に広めてしまっても、その利用を一定期間内に制限
することができ、第３者の勝手な使用による作成者の不
利益の発生を防ぐことができる音声メールシステム、音
声合成装置およびこれらの方法を提供することを目的と
する。

【００１１】また、本発明は、音質データの不適切な使
用を防ぐために、音質データの使用可能範囲を制限する
ことができる音声メールシステム、音声合成装置および
これらの方法を提供することを目的とする。

【００１２】

【課題を達成するための手段】上記目的を達成するため
に、本発明にかかる音声メールシステムの一態様（第１
の音声メールシステム）は、ネットワークを介して接続
された複数の端末装置を通信ノードとして含む音声メー
ルシステムであって、前記端末装置それぞれは、複数の
音声それぞれの音質を示す前記音質データそれぞれを、
それぞれネットワーク内でユニークな１つ以上の識別子
と対応付けて管理する音質データ管理手段と、少なくと
も通信文および前記識別子を含むメールを受信するメー
ル受信手段と、受信した前記メールが含む前記識別子と
対応付けて管理した前記音質データが示す音質で、受信
した前記メールが含む通信文の内容を示す音声を合成す
る音声合成手段と、合成した前記音声を出力する音声出
力手段とを有する。

【００１３】また、本発明にかかる音声メールシステム
の他の一態様（第２の音声メールシステム）は、ネット
ワークを介して接続された１つ以上の端末装置と１つ以
上の音声メールサーバー装置とを通信ノードとして含む
音声メールシステムであって、前記音声メールサーバー
装置は、複数の音声それぞれの音質を示す前記音質デー
タそれぞれを、それぞれネットワーク内でユニークな１
つ以上の識別子と対応付けて管理する音質データ管理手
段と、少なくとも通信文および前記識別子を含むメール
を受信するメール受信手段と、受信した前記メールが含
む前記識別子と対応付けて管理した前記音質データが示
す音質で、受信した前記メールが含む通信文の内容を示
す音声を合成する音声合成手段と、前記複数の端末装置
のいずれかからの要求に応じて、合成した前記音声を前
記複数の端末装置のいずれかに対して出力する音声出力
手段とを有する。

【００１４】また、本発明にかかる音声メールシステム
の他の一態様において、前記端末装置それぞれは、前記
メールを、前記ネットワークを介して他の通信ノードに
対して送信するメール送信手段を有する。

【００１５】また、本発明にかかる音声メールシステム
の他の一態様において、前記メールは、少なくとも通信
文および送信元の前記識別子を含み、前記音声合成手段
は、受信した前記メールが含む送信元の前記識別子と対
応付けた前記音質データが示す音質で、受信した前記メ
ールが含む通信文の内容を示す音声を合成する。

【００１６】また、本発明にかかる音声メールシステム
の他の一態様は、入力される音声それぞれの音質を示す
音質データを抽出し、それぞれ前記ネットワーク内でユ
ニークな１つ以上の識別子と対応付けて、前記ネットワ
ークを介して前記通信ノードそれぞれに送信する音質デ
ータ抽出手段をさらに有し、前記音質データ管理手段
は、前記ネットワークを介して前記抽出した音質データ
それぞれを受信し、受信した前記音質データを、それぞ
れネットワーク内でユニークな１つ以上の識別子と対応
付けて管理する。

【００１７】また、本発明にかかる音声メールシステム
の他の一態様において、前記通信ノードそれぞれは、動
作時刻を計る時計手段を有し、前記音質データそれぞれ
は、当該音質データの使用期限を示す期限データを含
み、前記音声合成手段は、前記通信ノードの動作時刻
が、前記音質データに含まれる前記期限データが示す使
用期限内である場合にのみ、前記音質データを用いて音
声を合成する。

【００１８】また、本発明にかかる音声メールシステム
の他の一態様において、前記メールは送信先の識別子を
含み、前記音質データそれぞれは、当該音質データの使
用を許可する送信先の識別子を示す使用許可データを含
み、前記音声合成手段は、前記メールに含まれる送信先
の識別子が、前記使用許可データが使用を許可する送信
先の識別子である場合に、前記音質データを用いて音声
を合成する。

【００１９】本発明にかかる第１の音声メールシステム
においては、データ通信が可能な電話網、ＩＳＤＮ網、
あるいは、ＬＡＮ等の通信ネットワークを介して接続さ
れた複数の端末装置が、相互に電子メールを伝送し、受
信した電子メールのテキストを、電子メールを送信した
ユーザーそれぞれに固有の音質で音声出力する。また、
本発明にかかる第２の音声メールシステムにおいては、
複数の端末装置が、上記通信ネットワークを介して接続
された音声メールサーバ装置に対して電子メールを送信
し、音声メールサーバ装置が、端末装置からの要求に応
じて、受信した電子メールのテキストを、電子メールを
送信したユーザーに固有の音質の音声で読み上げ、要求
を出した端末装置に送信する。

【００２０】音質データ抽出手段は、例えば、ユーザー
が入力する音声から母音および子音の音声素片を抽出
し、さらに、音声の言語、性別および年齢等を示す音声
特徴データを付加し、通信ネットワークにおいてユニー
クな各ユーザーの識別子（ＩＤ）、１つ以上と対応付け
て、ユーザー固有の音声の音質を示すデータ（音声素
片）を、あたかも、ユーザーごとに文字フォントのよう
に取り扱うができるようにした音質データ（ボイスフォ
ント）を生成する。

【００２１】上記端末装置および音声メールサーバ装置
は、例えば、音声処理機能を有するコンピュータであっ
て、一般のコンピュータと同様に、動作の日付および時
分（時刻）を計る機能を有する。端末装置または音声メ
ールサーバ装置において、音質データ管理手段は、音質
データ抽出手段が、各ユーザーのＩＤと対応付けた音質
データを記憶・管理する。メール受信手段は、通信文
（テキスト）、送信元の識別子（電子メールを送信した
ユーザーＩＤ）、使用期限（期限データ）および使用可
能な送信先識別子（使用許可データ）等を含み、端末装
置から通信ネットワークを介して送られてくる電子メー
ル、例えば、イントラネットあるいはインターネットに
おける通信で用いられるメールパケットを受信し、電子
メールに含まれるテキストとユーザーのＩＤ等とを分離
する。

【００２２】音声合成手段は、メール受信手段が分離し
たユーザーＩＤが示す音質データを、音質データ管理手
段から取得し、取得した音質データが示す音質の音声を
合成し、電子メールのテキストの内容を音声出力する。
さらに、音声合成手段は、音声合成を行なう日付・時分
（時刻）が、音質データに含まれる期限データが示す期
間内である場合にのみ、あるいは、使用許可データが示
す送信先においてのみ、その音質データを有効なものと
して扱って、音声合成に用いることにより、音質データ
の無制限な使用を制限する。

【００２３】端末装置において、音声出力手段は、音声
合成手段が合成した音声を、端末装置に設けられたスピ
ーカー等を介して受信側の端末装置のユーザーに対して
出力する。メール送信手段は、他の端末装置または音声
メールサーバ装置に対して、通信ネットワークを介し
て、上記電子メールを送信する。

【００２４】また、本発明にかかる第２の音声メールサ
ーバ装置において、音声出力手段は、例えば、メールを
受けたいユーザーが、端末装置のいずれかを操作して音
声メールサーバー装置との間に呼設定を行い、さらに、
ユーザーＩＤおよびパスワードを入力してメールの配信
を要求した場合に、音声合成手段を制御して、このユー
ザー宛の電子メールのテキストの内容を音声出力させ、
通信ネットワークを介してユーザーが操作する端末装置
に配信する。

【００２５】また、本発明にかかる音声合成装置は、少
なくとも通信文および前記識別子を含むメールの通信文
の音声を合成する音声合成装置であって、複数の音声そ
れぞれの音質を示す音質データそれぞれを、それぞれ前
記メールを伝送するネットワーク内でユニークな１つ以
上の識別子と対応付けて管理する音質データ管理手段
と、前記識別子と対応付けて管理した前記音質データが
示す音質で、受信した前記メールが含む通信文の内容を
示す音声を合成する音声合成手段とを有する。

【００２６】また、本発明にかかる音声メール通信方法
は、複数の音声それぞれの音質を示す前記音質データそ
れぞれを、それぞれネットワーク内でユニークな１つ以
上の識別子と対応付けて管理し、少なくとも通信文およ
び前記識別子を含むメールを受信し、受信した前記メー
ルが含む前記識別子と対応付けた前記音質データが示す
音質で、受信した前記メールが含む通信文の内容を示す
音声を合成し、合成した前記音声を出力する。

【００２７】また、本発明にかかる音声合成方法は、少
なくとも通信文および前記識別子を含むメールの通信文
の音声を合成する音声合成方法であって、複数の音声そ
れぞれの音質を示す音質データそれぞれを、それぞれ前
記メールを伝送するネットワーク内でユニークな１つ以
上の識別子と対応付けて管理し、前記識別子と対応付け
て管理した前記音質データが示す音質で、受信した前記
メールが含む通信文の内容を示す音声を合成する。

【００２８】また、本発明にかかるコンピュータ読み取
り可能な記録媒体は、複数の音声それぞれの音質を示す
前記音質データそれぞれを、それぞれネットワーク内で
ユニークな１つ以上の識別子と対応付けて管理するステ
ップと、少なくとも通信文および前記識別子を含むメー
ルを受信するステップと、受信した前記メールが含む前
記識別子と対応付けた前記音質データが示す音質で、受
信した前記メールが含む通信文の内容を示す音声を合成
するステップとをコンピュータに実行させるプログラム
を記録する。

【００２９】

【発明の実施の形態】

［第１実施形態］以下、本発明の第１の実施形態を説明
する。

【００３０】［音声メールシステム１の構成］以下、本
発明にかかる音声メールシステム１の構成を説明する。
図１は、本発明の第１の実施形態として示す音声メール
システム１の構成図である。図１に示すように、音声メ
ールシステム１は、１つ以上のネットワーク、例えば、
通信ネットワーク２ａ，２ｂ（ネットワークＡ，ネット
ワークＢ)の２つから構成される。通信ネットワーク２
ａ，２ｂはそれぞれ、データ伝送が可能なＩＳＤＮ通信
網、電話網およびＬＡＮ等の通信網２０ａ，２０ｂ、通
信ネットワーク２ａ，２ｂ、その他のネットワーク（図
示せず）との間を相互接続するゲートウェイプロセッサ
（ＧＷＰ）２２ａ−１，２２ａ−２，２２ｂ−１，２２
ｂ−２、および、通信網２０ａ，２０ｂに接続された複
数の端末装置３ａ−１〜３ａ−ｍ，３ｂ−１〜３ｂ−ｎ
（ｍ，ｎは任意の整数、図１はｍ，ｎ＝６の場合を例
示）を通信ノードとして含む。音声メールシステム１
は、これらの構成部分により、複数の端末装置３（以
下、複数の端末装置を、いずれかに特定せずに記す場合
には、端末装置３と略記する）の間で電子メールを伝送
し、電子メールのテキスト部分を音声出力する。

【００３１】［端末装置３の構成］以下、端末装置３の
構成を説明する。図２は、図１に示した端末装置３（３
ａ−１〜３ａ−６，３ｂ−１〜３ｂ−６）の構成を示す
図である。図３は、図１および図２に示した端末装置３
の間で伝送される電子メールの構成を示す図である。図
２に示すように、端末装置３は、例えば、動作年月日お
よび時分を計る（時計）機能および音声出力機能等を有
するマルチメディアコンピュータであって、受信部（Ｒ
Ｘ）３０、音声合成部３２、ボイスフォント（ＶＦ； v
oice font）入力部３４、ボイスフォント生成装置３
６、音声出力部３８、キーボードおよびマウス等を有す
る入力装置４０、送信・制御部４２および送信部（Ｔ
Ｘ）４４から構成される。なお、図２において、端末装
置３のマルチメディアコンピュータとしての構成部分の
うち、ハードデスク装置およびモニタ装置等、本発明の
説明に直接、関係ないものは省略されている。

【００３２】音声合成部３２は、テキスト解析部３２
０、韻律制御部３２２、音声生成部３２４、ボイスフォ
ントデータベース部（ＶＦＤＢ）３３０、ボイスフォン
ト切替部（ＶＦＳＷ）３２６、ボイスフォント検索部３
２８から構成される。ボイスフォント生成装置３６は、
ボイスフォント生成部（ＶＦＧ）３６０およびボイスフ
ォント生成制御部（ＶＦＧＣ）３６２から構成される。

【００３３】端末装置３はそれぞれ、これらの構成部分
により、図３に示すように、ヘッダ部分に送信元の識別
子（送信元ＩＤ）、送信先ＩＤ、経由ノードおよび電子
メール送信の年月日および時分（時刻）等のデータを含
み、メールテキスト部分に通信文（テキスト）を含む電
子メールを、送信データとして通信ネットワーク２ａ，
２ｂを介して他の端末装置３に対して送信する。また、
端末装置３はそれぞれ、他の端末装置３から通信ネット
ワーク２ａ，２ｂを介して受信データとして受信した電
子メール（図３）のメールテキスト部分に含まれるテキ
ストの内容を、ヘッダ部分に含まれる送信元識別子（Ｉ
Ｄ）それぞれに対応する音質の音声、例えば、電子メー
ルを送信したユーザーの声で音声出力する。

【００３４】［端末装置３の各構成部分］以下、図２に
示した端末装置３の各構成部分を説明する。

【００３５】［受信部３０］受信部３０は、接続されて
いる通信ネットワーク２ａ，２ｂが、例えば、ＩＳＤＮ
通信網である場合にはＩＳＤＮ回線アダプタ（ＴＡ；te
rminal adapter）の受信部、電話網である場合にはモデ
ムの受信部、ＬＡＮの場合にはＬＡＮ接続ボードの受信
部を含み、通信ネットワーク２ａ，２ｂから受信データ
として入力される電子メール（図３）を受信して開き、
開いた電子メールに含まれるテキスト（TEXT)を分離し
てテキスト解析部３２０に対して出力し、ヘッダ(HEADE
R)に含まれる送信元ＩＤを分離してボイスフォント切替
部３２６に対して出力する。また、受信部３０は、受信
した電子メールが音質データを含む場合には、電子メー
ルから音質データを分離し、ボイスフォントデータベー
ス部３３０に対して出力する。

【００３６】なお、音質データは、例えば、音声メール
システム１の任意のユーザーの声に含まれる母音（日本
語の場合にはa,i,u,e,o）および子音（日本語の場合に
はk,s,t,n,h,m,y,r,w,g,z,d,b,p等）から抽出されるパ
ラメータ（スペクトラムおよび波形情報等）を示す音声
素片に、下表に例示するヘッダデータを付したものであ
って、ヘッダデータには、音声素片を用いて音声を合成
する際に、音声に特徴を与えるために用いられる言語、
個性および年齢等を示す音声特徴データ(language, wGe
nder, wAge等）を含む。また、文字の形を特徴付けるフ
ォントデータと同様に、合成音声の音質を特徴付けるの
で、音質データはボイスフォントとも呼ばれる。

【００３７】

【表１】（表１；音質データのヘッダデータの構造） typedef struct{//ttsmi GUID gEngineID; TCHAR szMfgName [TTSI_NAMELEN]; TCHAR szProductName [TTSI_NAMELEN]; GUID gModeID; TCHAR szModeName [TTSI_NAMELEN]; LANGUAGE language; TCHAR szSpeaker [TTSI_NAMELEN]; TCHAR szStyle [TTSI_NAMELEN]; WORD wGender WORD wAge DWORD dwFeatures DWORD dwInterfaces DWORD dwEngineFeatures TCHAR szMailID ［TTSI_MAILIDLEN]; } TISMODEINFO, *PTTSMODEINFO; 但し、GUID, WORD, DWORD, LANGUAGEは、予め定義され
るデータの型を示し、TTSI_NAMELENは、名前の文字列長
を示し、TTSI_MAILIDLENは、MailIDの文字列長の最大値
を示し、 gEngineID :音質データの生成あるいは音声合成を行う
装置(音声合成エンジン)に固有の識別子(ID) szMfgName :装置(エンジン)の製造者の名称（例"zzz Co
rporation"） szProductName :装置(エンジン)の名称（例"zzz's vv
v"） gModeID :装置に複数の動作モードがある場合の動作モ
ードの識別子(ID) szModeName :音声合成処理に複数の処理モードがある場
合の処理モードの識別子（ID) language :合成する音声の言語(例、Japanese, Englis
h etc.) szSpeaker :音声素片の名称(例えば、電子メールを送信
するユーザー) szStyle :声の個性(例、"Business, Casual, Computer,
Excited, SingSong"） wGender :声の性別［例、"GENDER_FEMALE（女性）"，"G
ENDER_MALE（男性）"，"GENDER_NEUTRAL（特に女性でも
男性でもない声）"］ wAge :声の年齢［例、"TISAGE_BABY（１歳程度）"，"TI
SAGE_TODDLER（３歳程度）"，"TISAGE_CHILD（６歳程
度）"，"TISAGE_ADOLESCENT（１４歳程度）"，"TISAGE_
ADULT（２０〜６０歳程度）"，"TISAGE_ELDERLY（約６
０歳以上）"］ dwFeatures :装置(エンジン)で利用可能な音声合成機能
の識別子(ID)［例、"TISFERATURE_ANYWORD（任意単語の
読み上げ）"，"TISFERATURE_IPAUNICODE（Internationa
l Phonetic Alphabet (IPA)発音記号のサポート)"，"TI
SFERATURE_PCOTIMIZED（音声の質の最適化）"，"TISFER
ATURE_PHONEOPTIMIZED（８kHzサンプリングレートの電
話網での使用が可能）"，"TISFERATURE_PITCH（ピッチ
調整）"，"TISFERATURE_SPEED（スピード調整）"，"TIS
FERATURE_TAGGED（タグテキストによる制御）"，"TISFE
RATURE_VISUAL（口の形状情報の提供）"，"TISFERATURE
_VOLUME（音量調整）"，"TISFERATURE_WORDPOSITION
（読み上げ中の単語位置の報告）"］ dwInterfaces :装置（エンジン）がサポートするインタ
ーフェース［例、"TISI_ILEXPRONOUNCE(ILexPronounce
interface)"，"TISI_ITTSATTRIBUTES(ITTSAttributes i
nterface)"，"TISI_ITTSCENTRAL(ITTSCentral interfac
e)"，"TISI_ITTSDIALOGS(ITTSDialogs interface)"，］ dwEngineFeatures :装置（エンジン）特有の特徴
［例、"TISFEATURE_SPEED（スピード調整）"，"TISFERA
TURE_TAGGED（タグテキストによる制御）"，"TISFERATU
RE_VISUAL（口の形状情報の提供）"，"TISFERATURE_VOL
UME（音量調整）"，"TISFERATURE_WORDPOSITION（読み
上げ中の単語位置の報告）"］ szMailID :音質データと対応付けられた1つ以上のユー
ザーＩＤ［例、同一ユーザーの企業内ネットワーク(イ
ントラネット)ＩＤ(xxx/www/zzz)とインターネットＩＤ
(xxx @ yyy.zzz.com)］である。

【００３８】［音声合成部３２］音声合成部３２は、受
信部３０から入力される電子メール（図３）のヘッダに
含まれる送信元ＩＤに対応する音質データに含まれる音
声素片および音声特徴データを用いてテキストの内容を
示す音声を合成し、出力する。

【００３９】［ボイスフォントデータベース部３３０］
音声合成部３２において、ボイスフォントデータベース
部３３０は、受信部３０、ボイスフォント入力部３４お
よびボイスフォント生成装置３６から入力される音質デ
ータを記憶・管理し、ボイスフォント検索部３２８の制
御に応じて韻律制御部３２２、音声生成部３２４および
送信部４４に対して出力する。

【００４０】［テキスト解析部３２０］テキスト解析部
３２０は、受信部３０から入力されるテキストを解析
し、テキストの読みを示すデータを、韻律制御部３２２
に対して出力する。具体的には、例えば、受信部３０か
ら入力されたテキストに日本語の「音声合成」という文
字列が含まれる場合には、テキスト解析部３２０は、文
字列「オンセイ」を解析して、その読みおよびアクセン
ト「オ・ン・セ・ー・ゴ＾・ー・セ・ー」（但し、＾は
アクセントの位置を示す）を表す発音データを生成し、
音声生成部３２４に対して出力する。

【００４１】［韻律制御部３２２］韻律制御部３２２
は、ボイスフォントデータベース部３３０から入力さ
れ、ボイスフォント切替部３２６により切り替えられた
音質データの内、表１に例示したヘッダデータに含まれ
る音声特徴データに基づいて、テキスト解析部３２０か
ら入力される発音データに、音声の韻律的な特徴を与え
る韻律データを付加し、音声生成部３２４に対して出力
する。

【００４２】［音声生成部３２４］音声生成部３２４
は、ボイスフォントデータベース部３３０から入力さ
れ、ボイスフォント切替部３２６により切り換えられた
音質データに含まれる音声素片と、テキスト解析部３２
０から韻律制御部３２２を介して入力される発音データ
とを対応付けて、音声出力部３８に対して出力する。

【００４３】［ボイスフォント切替部３２６］ボイスフ
ォント切替部３２６は、受信部３０から入力される電子
メール（図３）の送信元ＩＤに基づいて、ボイスフォン
ト検索部３２８を制御して、ボイスフォントデータベー
ス部３３０内の音質データを検索させる。さらに、ボイ
スフォント切替部３２６は、この検索結果に基づいて韻
律制御部３２２および音声生成部３２４を、ボイスフォ
ントデータベース部３３０内に送信元ＩＤに対応する音
質データが存在する場合には、処理に用いる音質データ
を、ボイスフォントデータベース部３３０から供給され
る送信元ＩＤに対応する音質データに切り替えるよう
に、送信元ＩＤに対応する音質データが存在しない場合
には、処理に用いる音質データを、送信元ＩＤに対応す
る音質データがない場合に用いる音質データ（デフォル
トの音質データ）に切り替えるように制御する。

【００４４】［ボイスフォント検索部３２８］ボイスフ
ォント検索部３２８は、ボイスフォント切替部３２６の
制御に応じて、ボイスフォントデータベース部３３０に
記憶・管理されている音質データを検索し、ボイスフォ
ントデータベース部３３０を制御して、送信元ＩＤに対
応する音質データが存在する場合には、送信元ＩＤに対
応する音質データを、韻律制御部３２２および音声生成
部３２４に供給させ、送信元ＩＤに対応する音質データ
が存在しない場合には、ボイスフォントデータベース部
３３０を制御して、デフォルトの音質データを、韻律制
御部３２２および音声生成部３２４に供給させる。ま
た、ボイスフォント検索部３２８は、ユーザーが、送信
先ＩＤおよびユーザーＩＤを入力装置４０に入力し、送
信・制御部４２に対して他の端末装置３に対して入力し
たユーザーＩＤに対応する音質データの送信を指示した
場合に、送信・制御部４２の制御に応じて、ボイスフォ
ントデータベース部３３０に記憶・管理されている音質
データを検索し、ユーザーＩＤに対応する音質データが
存在する場合には、ボイスフォントデータベース部３３
０を制御して、ユーザーＩＤに対応する音質データを送
信部４４に供給させる。

【００４５】［音声出力部３８］音声出力部３８は、音
声生成部３２４により発音データに対応付けられた音声
素片が示す音声を、韻律制御部３２２により発音データ
に対応付けられた音声特徴データに基づいて特徴付けた
音声信号を生成し、端末装置３に設けられたスピーカ
（ＳＰ；図示せず）等を介して出力する。

【００４６】［ボイスフォント入力部３４］ボイスフォ
ント入力部３４は、例えば、フロッピーディスク装置で
あって、フロッピーディスク等の記録媒体３４０に記録
された音質データを再生し、ボイスフォントデータベー
ス部３３０に対して出力する。

【００４７】［ボイスフォント生成装置３６］ボイスフ
ォント生成装置３６は、表１に示したヘッダデータを有
する音質データを生成し、ボイスフォントデータベース
部３３０に対して出力する。なお、ボイスフォント生成
装置３６は、受信部３０から分離されていてもよく、端
末装置３から分離されたボイスフォント生成装置３６が
生成した音質データは、通信網２０ａ，２０ｂあるいは
記録媒体３４０を介して各端末装置３に供給される。

【００４８】［ボイスフォント生成制御部３６２］ボイ
スフォント生成装置３６において、ボイスフォント生成
制御部３６２は、外部から入力されるユーザーＩＤ（表
１に示したszMailID）およびその他のヘッダデータを受
け入れ、ボイスフォント生成部３６０に対して出力す
る。また、ボイスフォント生成制御部３６２は、ユーザ
ーの操作に応じてボイスフォント生成部３６０を制御
し、外部から入力される音声信号からの音声素片の抽
出、および、音質データの生成を行わせる。

【００４９】［ボイスフォント生成部３６０］ボイスフ
ォント生成部３６０は、ボイスフォント生成制御部３６
２の制御に応じて、外部から入力されるユーザー等の音
声信号から音声素片を抽出し、さらに、抽出した音声素
片にボイスフォント生成制御部３６２から入力されるヘ
ッダデータを付加して音質データを生成し、ボイスフォ
ントデータベース部３３０に対して出力する。

【００５０】［送信・制御部４２］送信・制御部４２
は、ユーザーが入力装置４０に送信先ＩＤおよびテキス
トの内容等を入力し、電子メール（図３）の送信を指示
した場合に、電子メールを生成して、送信部４４および
通信ネットワーク２ａ，２ｂ（図１）を介して送信先の
端末装置３に対して出力する。また、送信・制御部４２
は、ユーザーが上述のように音質データの送信を指示し
た場合に、送信部４４を制御して音質データをテキスト
として含む電子メールを、他の端末装置３に対して送信
させる。

【００５１】［送信部４４］送信部４４は、接続されて
いる通信ネットワーク２ａ，２ｂが、例えば、ＩＳＤＮ
通信網である場合にはＩＳＤＮ回線アダプタ（ＴＡ）の
送信部、電話網である場合にはモデムの送信部、ＬＡＮ
の場合にはＬＡＮ接続ボードの送信部を含み、入力装置
４０から入力された電子メールを、通信ネットワーク２
ａ，２ｂを介して他の端末装置３に対して送信する。ま
た、送信部４４は、入力装置４０の制御に応じて、音質
データをテキスト内に含む電子メールを生成して、通信
ネットワーク２ａ，２ｂを介して他の端末装置３に対し
て送信する。

【００５２】[音声メールシステム１の動作]以下、端末
装置３ａ−１（図１，図２）が音質データを作成し、３
ｂ−１に対して音質データおよび電子メールを送信し、
端末装置３ｂ−１が、端末装置３ａ−１から受信した電
子メールを、受信した音質データが示す音質で音声出力
する場合を例に、音声メールシステム１の動作を説明す
る。

【００５３】［音質データの作成］まず、端末装置３ａ
−１が音質データを作成する際の動作を説明する。ユー
ザーは、ボイスフォント生成装置３６のボイスフォント
生成制御部３６２に対して所定の操作を行ない、音質デ
ータの作成を指示し、さらに、音声素片に対応付けるユ
ーザーＩＤおよびその他の音声特徴データ（表１）を入
力する。ボイスフォント生成制御部３６２は、ユーザー
に対して、例えば、音声およびモニタ表示により、母音
および子音の音声素片の抽出に必要な音声の入力を促す
指示を行ない、さらに、ボイスフォント生成部３６０を
制御して、ボイスフォント生成部３６０に対してユーザ
ーの音声を受け入れさせる。

【００５４】ユーザーは、ボイスフォント生成制御部３
６２による音声の入力を促す指示に応じて発音し、ボイ
スフォント生成制御部３６２に対してマイク（図示せ
ず）を介して音声を入力し、ボイスフォント生成制御部
３６２は、入力されたアナログ音声を、ディジタル形式
の音声データに変換し、記憶する。さらに、ボイスフォ
ント生成部３６０に対する音声の入力が終了すると、ユ
ーザーは、ボイスフォント生成制御部３６２に対して所
定の操作を行ない、音声入力の終了を通知する。

【００５５】ボイスフォント生成部３６０は、ユーザー
の音声入力の終了の通知に応じてボイスフォント生成制
御部３６２を制御して、記憶した音声データからケプス
トラムパラメータを抽出させ、音声素片を生成させる。
さらに、ボイスフォント生成部３６０は、ボイスフォン
ト生成制御部３６２を制御して、ユーザーＩＤおよびそ
の他の音声特徴データと、作成した音声素片とを対応付
けさせて音質データを作成させ、ボイスフォントデータ
ベース部３３０に対して出力させる。ボイスフォントデ
ータベース部３３０は、ボイスフォント生成制御部３６
２から入力された音質データそれぞれをファイルとして
記録し、記録した音質データを管理する。

【００５６】［音質データの送信］次に、通信ネットワ
ーク２ａ内の端末装置３ａ−１が、通信ネットワーク２
ｂ内の端末装置３ｂ−１およびその他の端末装置３に対
して、メールテキスト部分に音質データを含む電子メー
ル（図３）を送信する際の動作を説明する。まず、端末
装置３ａ−１のユーザーは、端末装置３ａ−１の入力装
置４０を操作して、送信先（端末装置３ｂ−１およびそ
の他の端末装置３）の電子メールアドレス、および、送
信しようとする音質データを示すユーザーＩＤを入力
し、端末装置３ａ−１に対して、音質データの送信を指
示する。

【００５７】入力装置４０は、ユーザーが入力した電子
メールアドレス、ユーザーＩＤおよび音質データの送信
の指示を受け入れ、送信・制御部４２に対して出力す
る。送信・制御部４２は、端末装置３ａ−１の電子メー
ルアドレスを送信元ＩＤとして、端末装置３ｂ−１およ
びその他の端末装置３の電子メールアドレスを送信先Ｉ
Ｄとして送信部４４に対して出力し、音声合成部３２の
ボイスフォント検索部３２８に対して、音質データを示
すユーザーＩＤを出力し、さらに、ボイスフォント検索
部３２８を制御して、出力したユーザーＩＤをヘッダデ
ータ内にszMailID（表１）として含む音質データを検索
させる。

【００５８】ボイスフォント検索部３２８は、送信・制
御部４２の制御に応じて、ボイスフォントデータベース
部３３０が記憶・管理する音質データの内、入力された
ユーザーＩＤを含む音質データを検索し、ボイスフォン
トデータベース部３３０を制御して、該当する音質デー
タを送信部４４に対して出力させる。送信部４４は、送
信・制御部４２から入力された送信元ＩＤおよび送信先
ＩＤをヘッダ部分に多重化し、検索の結果として得られ
た音質データをメールテキスト部分に多重化して電子メ
ールを作成し、通信網２０ａ，２０ｂを介して端末装置
３ｂ−１およびその他の端末装置３に対して、個別送信
あるいは同報送信する。

【００５９】［音質データの受信］次に、通信ネットワ
ーク２ｂ内の端末装置３ｂ−１が、通信ネットワーク２
ａ内の端末装置３ａが送信した音質データを含む電子メ
ール（図３）を送信する際の動作を説明する。端末装置
３ｂ−１の受信部３０は、端末装置３ａ−１から伝送さ
れてきた音質データを含む電子メールを受信すると、電
子メールのメールテキスト部分の内容を検査し、音質デ
ータが含まれている場合には、受信した電子メールから
音質データ（ＶＦ）を分離し、ボイスフォントデータベ
ース部３３０に対して出力する。ボイスフォントデータ
ベース部３３０は、受信部３０から入力された音質デー
タを記憶・管理する。

【００６０】［電子メールの送信］次に、通信ネットワ
ーク２ａ内の端末装置３ａ−１が、通信ネットワーク２
ｂ内の端末装置３ｂ−１に対して電子メール（図３）を
送信する際の動作を説明する。まず、端末装置３ａ−１
のユーザーは、端末装置３ａ−１の入力装置４０を操作
して、送信先（端末装置３ｂ−１）の電子メールアドレ
スおよび通信文（音質データ以外のテキストデータ等）
を入力し、端末装置３ａ−１に対して端末装置３ｂ−１
への電子メールの送信を指示する。

【００６１】入力装置４０は、ユーザーが入力した電子
メールアドレス、通信文および電子メール送信の指示を
受け入れ、送信・制御部４２に対して出力する。送信・
制御部４２は、端末装置３ａ−１の電子メールアドレス
を送信元ＩＤとして、端末装置３ｂ−２の電子メールア
ドレスを送信先ＩＤとして、通信文をテキストとして送
信部４４に対して出力する。送信部４４は、送信・制御
部４２から入力された送信元ＩＤおよび送信先ＩＤをヘ
ッダ部分に多重化し、テキストを電子メールのメールテ
キスト部分に多重化して、電子メールを作成し、通信網
２０ａ，２０ｂを介して端末装置３ｂ−１に対して出力
する。

【００６２】［電子メールの受信・音声出力］次に、通
信ネットワーク２ｂ内の端末装置３ｂ−１が、通信ネッ
トワーク２ａ内の端末装置３ａ−１が送信した電子メー
ル（図３）を受信し、音声出力する際の動作を説明す
る。端末装置３ｂ−１の受信部３０は、端末装置３ａ−
１から伝送されてきた通信文を含む電子メールを受信す
ると、電子メールのテキストデータの内容を検査し、テ
キストデータに音質データが含まれていない場合には、
受信した電子メールから通信文を分離し、テキストとし
て音声合成部３２のテキスト解析部３２０に対して出力
し、さらに、ヘッダから送信元ＩＤを分離してボイスフ
ォント切替部３２６に対して出力する。

【００６３】ボイスフォント切替部３２６は、受信部３
０から入力された送信元ＩＤをボイスフォント検索部３
２８に対して出力し、ボイスフォント検索部３２８を制
御して、ボイスフォントデータベース部３３０内の音質
データを検索させる。ボイスフォント検索部３２８は、
ボイスフォント切替部３２６の制御に応じて、ボイスフ
ォントデータベース部３３０内の音質データを検索し、
検索結果に応じてボイスフォントデータベース部３３０
を制御し、ヘッダデータに含まれるユーザーＩＤ（szMa
ilID；表１）が、ボイスフォント切替部３２６から入力
された送信元ＩＤと一致する音質データが存在する場合
には、ボイスフォントデータベース部３３０を制御し
て、送信元ＩＤに対応する音質データを供給させ、送信
元ＩＤに対応する音質データが存在しない場合には、デ
フォルトの音質データを韻律制御部３２２および音声生
成部３２４に供給させる。

【００６４】ボイスフォント切替部３２６は、ボイスフ
ォント検索部３２８の検査結果に基づいて、ボイスフォ
ントデータベース部３３０内に送信元ＩＤに対応する音
質データが存在する場合には送信元ＩＤに対応する音質
データに切り替え、送信元ＩＤに対応する音質データが
存在しない場合にはデフォルトの音質データ）に切り替
えて処理を行なうように韻律制御部３２２および音声生
成部３２４を制御する。

【００６５】韻律制御部３２２は、ボイスフォントデー
タベース部３３０から入力され、ボイスフォント切替部
３２６により切り替えられた音質データのヘッダデータ
に含まれる音声特徴データを用いて、テキスト解析部３
２０から入力される発音データに、音声の韻律的な特徴
を示す韻律データを付加し、音声生成部３２４に対して
出力する。

【００６６】音声生成部３２４は、ボイスフォントデー
タベース部３３０から入力され、ボイスフォント切替部
３２６により切り換えられた音質データに含まれる音声
素片と、テキスト解析部３２０から韻律制御部３２２を
介して入力される発音データとを対応付けて、音声出力
部３８に対して出力する。音声出力部３８は、音声生成
部３２４から入力された発音データに対応する音声素片
が示す音質および音声特徴データが示す特徴を有する音
声信号を生成し、外部に出力する。

【００６７】以下、図４を参照して、端末装置３ｂ−１
が、端末装置３ａ−１から受信した電子メールのテキス
トを音声出力する際の処理を、さらに説明する。図４
は、図１および図２に示した端末装置３（３ｂ−１）の
音声出力処理を示すフローチャート図である。

【００６８】図４に示すように、ステップ１００（Ｓ１
００）において、端末装置３ｂ−１の受信部３０は、通
信網２０ａ，２０ｂを介して端末装置３ａ−１から電子
メールを受信し、受信した電子メールを開き、電子メー
ルのヘッダから送信元ＩＤを分離してボイスフォント切
替部３２６に対して出力し、テキストを分離して音声合
成部３２のテキスト解析部３２０に対して出力する。

【００６９】ステップ１０２（Ｓ１０２）において、ボ
イスフォント切替部３２６は、受信部３０から入力され
た送信元ＩＤを取得する。

【００７０】ステップ１０４（Ｓ１０４）において、ボ
イスフォント切替部３２６は、音質データの切り替えを
ボイスフォント検索部３２８に対して指示する。

【００７１】ステップ１０６（Ｓ１０６）において、ボ
イスフォント切替部３２６は、韻律制御部３２２および
音声生成部３２４に、音声出力処理用に設定されている
音質データが、処理に使用するために設定されている
（現在使用中の）音質データであるか否かを判断し、現
在使用中の音質データである場合にはＳ１１８の処理に
進み、現在使用中の音質データでない場合にはＳ１０８
の処理に進む。

【００７２】ステップ１０８（Ｓ１０８）において、ボ
イスフォント切替部３２６は、ボイスフォント検索部３
２８を制御し、送信元のユーザーＩＤ（送信元ＩＤ）に
対応する音質データが、ボイスフォントデータベース部
３３０内に存在するか否かを検索させる。

【００７３】ステップ１１０（Ｓ１１０）において、ボ
イスフォント切替部３２６は、ボイスフォント検索部３
２８の検索結果に基づいて、ボイスフォントデータベー
ス部３３０内に送信元ＩＤに対応する音質データがある
か否かを判断し、送信元ＩＤに対応する音質データがあ
る場合にはＳ１１２の処理に進み、送信元ＩＤに対応す
る音質データがない場合にはＳ１１４の処理に進む。

【００７４】ステップ１１２（Ｓ１１２）において、ボ
イスフォント切替部３２６は、ボイスフォント検索部３
２８を制御して、ボイスフォントデータベース部３３０
から送信元ＩＤに対応する音質データを、韻律制御部３
２２および音声生成部３２４に供給させるとともに、そ
れまで使用していた音質データの代わりに、ボイスフォ
ント検索部３２８の検索の結果として得られた送信元Ｉ
Ｄに対応する音質データを切り替えて用いるように、韻
律制御部３２２および音声生成部３２４を制御する。

【００７５】ステップ１１４（Ｓ１１４）において、ボ
イスフォント切替部３２６は、ボイスフォント検索部３
２８を制御して、ボイスフォントデータベース部３３０
からデフォルトの音質データを、韻律制御部３２２およ
び音声生成部３２４に供給させるとともに、それまで使
用していた音質データの代わりに、デフォルトの音質デ
ータを切り替えて用いるように、韻律制御部３２２およ
び音声生成部３２４を制御する。

【００７６】ステップ１１６（Ｓ１１６）において、韻
律制御部３２２および音声生成部３２４は、ボイスフォ
ント切替部３２６の制御に従って、それまで処理に使用
していた音質データの音声素片および韻律パラメータの
代わりに、ボイスフォントデータベース部３３０から新
たに供給された音質データの音声素片および韻律パラメ
ータを処理に使用するように設定を変更する。

【００７７】ステップ１１８（Ｓ１１８）において、テ
キスト解析部３２０は、受信した電子メールのテキスト
を解析して発音データを生成し、韻律制御部３２２に対
して出力する。

【００７８】ステップ１２０（Ｓ１２０）において、韻
律制御部３２２および音声生成部３２４は、ボイスフォ
ント切替部３２６の制御に従って、テキスト解析部３２
０が生成した発音データに、処理に使用するように設定
されている音質データの音声素片を対応付け、さらに、
音声特徴データを付加して音声出力部３８に対して出力
する。音声出力部３８は、音声生成部３２４から入力さ
れた音声素片が示す音質、および、音声特徴データが示
す特徴を有する音声信号を合成し、外部に出力する。

【００７９】［音声メールシステム１を用いることによ
る効果］以上説明したように、第１の実施形態として示
した音声メールシステム１によれば、音声素片および音
声特徴データがユーザーＩＤと既に対応付けられた形で
端末装置３それぞれに音質データとして供給される。従
って、端末装置３それぞれは、音声素片および音声特徴
データとユーザーＩＤとを対応付けたテーブルを持たず
に送信元ＩＤに応じた音質の音声でメールの音声出力を
行なうことができる。

【００８０】しかも、全ての端末装置３に対して、音質
データを記録媒体３４０あるいは通信網２０ａ，２０ｂ
を介して供給することができるので、音声メールシステ
ム１内の全ての端末装置３に同一の音質データを供給す
ることができる。また、全ての端末装置３に対して、更
新後の音質データを記録媒体３４０等を介して供給する
ことにより、音声メールシステム１内の全ての端末装置
３内の音質データを一括して更新することができる。

【００８１】また、音声メールシステム１においては、
音声素片および音声特徴データと、ネットワーク内でユ
ニークなユーザーＩＤとを対応付けた音質データが作成
されるので、各ユーザーの音質データに対して確実に識
別子を付すことができる

【００８２】また、音声メールシステム１においては、
ボイスフォント生成装置３６を利用して簡単に音質デー
タを作成し、全ての端末装置３に設定可能であるので、
システム管理者の手間が不要である。逆に、全ての端末
装置３における音質データを一致させる必要は必ずしも
ないので、表１に示した音声特徴データの設定を、設定
先に応じて変更することにより、友人の端末装置３には
カジュアルな口調で電子メールの音声出力を行ない、仕
事関係の端末装置３にはビジネスに適した口調で電子メ
ールの音声出力を行なうようにする等、場合に応じて音
声出力に用いる音声の口調を変更することも可能であ
る。

【００８３】［変形例等］なお、上記実施形態において
は、通信ネットワーク２ａ内の端末装置３ａ−１および
通信ネットワーク２ｂ内の端末装置３ｂ−１の動作のみ
を示したが、他の端末装置３の動作も同じであり、任意
の端末装置３の間で電子メールの送信、受信および音声
出力が可能である。また、上記実施形態においては、通
信ネットワーク２ａ，２ｂそれぞれの３の間で、複数の
ネットワークにまたがった電子メールの伝送を行なう場
合を説明したが、通信ネットワーク２ａ，２ｂそれぞれ
に閉じた形でのみ、端末装置３間の電子メールの送信、
受信および音声出力が可能なように構成を変更すること
ができる。なお、上記実施例においては、受信部３０が
テキスト解析部３２０に対して電子メールのテキストの
みを出力する場合を例示したが、電子メール全体をテキ
スト解析部３２０に対して出力し、送信元ＩＤおよび送
信先ＩＤもテキストとともに音声出力するように構成を
変形することができる。

【００８４】また、表１に示した音声特徴データは例示
であって、例えば、音声特徴データに「お国なまり」を
示すデータ等、他のデータを追加したり、必要ないデー
タを省略する等の変更が可能である。また、図２に示し
た端末装置３の構成は例示であって、端末装置３の各部
分は、同一の機能および性能を達成することができる限
り、同等の他の手段に置換することができ、また、ハー
ドウェア的に構成されるか、ソフトウェア的に構成され
るかを問わない。

【００８５】[第２実施形態]以下、本発明の第２の実施
形態を説明する。第１の実施形態として示した音声メー
ルシステム１においては、各端末装置３（３ａ−１〜３
ａ−ｍ，３ｂ−１〜３ｂ−ｎ）が音質データを記録・管
理し、電子メールを音声出力するように構成されてい
た。しかしながら、音声メールシステム１においては、
音声合成機能等を有さない一般的な電話機を用いて電子
メールの音声出力機能を利用することはできない。第２
の実施形態として示す通信ネットワーク２ｃは、かかる
観点から、一般的な電話機に対してもテキストの音声出
力機能を提供しうるように音声メールシステム１をさら
に改良したものである。

【００８６】［通信ネットワーク２ｃの構成］以下、本
発明にかかる通信ネットワーク２ｃ（ネットワークＣ）
の構成を説明する。図５は、本発明の第２の実施形態と
して示す通信ネットワーク２ｃの構成を示す図である。
図５に示すように、通信ネットワーク２ｃは、通信網２
０ｃに接続されたゲートウェイプロセッサ２２ｃ−１，
２２ｃ−２、端末装置３ｃ−１〜３ｃ−ｐ（図５におい
てはｐ＝４の場合を例示）、電子メールサーバ５および
電話機６を通信ノードとして含む。

【００８７】なお、図５において、通信ネットワーク２
ｃの通信網２０ｃは、図１に示した音声メールシステム
１の通信網２０ａ，２０ｂに対応し、ゲートウェイプロ
セッサ２２ｃ−１，２２ｃ−２はゲートウェイプロセッ
サ２２ａ−１，２２ａ−１，２２ｂ−１，２２ｂ−２に
対応し、端末装置３ｃ−１〜３ｃ−ｐ（端末装置３ａ−
１〜３ａ−ｍ，３ｂ−１〜３ｂ−ｎと同様に、以下、端
末装置３と略記する）は、図１および図２に示した端末
装置３ａ−１〜３ａ−ｍ，３ｂ−１〜３ｂ−ｎに対応
し、これらの対応する構成部分は同一構成であって、同
一の機能を有する。ゲートウェイプロセッサ２２ｃは、
これらの構成部分により、ユーザーに対して音声メール
システム１においてと同様な電子メールのテキストの音
声出力機能を提供するとともに、音声合成機能等を有さ
ない一般的な電話機６に対しても、ユーザーそれぞれに
個別の音質データを用いたテキストの音声出力機能を提
供する。

【００８８】［通信ネットワーク２ｃの各構成部分］以
下、通信ネットワーク２ｃの構成部分の内、音声メール
システム１（図１）の構成部分と異なる電子メールサー
バー５および電話機６を説明する。

【００８９】［電話機６］電話機６は、例えば、ＤＴＭ
Ｆ(dual tone multi frequency)送信機能を有するアナ
ログ電話機、あるいは、ＩＳＤＮ端末であって、通信網
２０ｃを介して端末装置３あるいは他の電話機（図示せ
ず）の間で音声信号を送信および受信するとともに、Ｄ
ＴＭＦあるいはディジタルデータの形式で、ユーザーＩ
Ｄ、パスワードおよびその他の操作データを電子メール
サーバー５に対して送信する。

【００９０】［電子メールサーバー５］以下、図６を参
照して、電子メールサーバー５の構成を説明する。図６
は、図５に示した電子メールサーバー５の構成を示す図
である。図６に示すように、電子メールサーバー５は、
音声合成部３２、入力装置４０、受信部５０、電子メー
ルデータベース（ＥＭＤＢ）５２、再生制御部５４およ
び送信部５６から構成される。なお、図６においては、
電子メールサーバー５の構成部分の内、図１および図２
に示した端末装置３の構成部分と同じものには同一の符
号を付して示してある。電子メールサーバー５は、これ
らの構成部分により、端末装置３から通信網２０ｃを介
して受信した電子メールのテキストおよび音質データを
記憶・管理し、電話機６から操作に応じて、電子メール
の送信元ＩＤに対応する音質の音声でテキストを読み上
げる音声信号を生成し、電話機６に送信する。

【００９１】［電子メールサーバー５の構成部分］以
下、電子メールサーバー５の各構成部分を説明する。

【００９２】［受信部５０］電子メールサーバー５にお
いて、受信部５０は、端末装置３の受信部３０に対応
し、受信部３０と同様に、通信網２０ｃの種類に応じて
ＴＡ、モデムあるいはＬＡＮ接続ボードの受信部を含
み、通信網２０ｃから受信データとして入力される電子
メール（図３）を受信して開き、開いた電子メール（テ
キストおよびヘッダ）を電子メールデータベース５２に
対して出力して、音声合成部３２のボイスフォント切替
部３２６に対して出力する。また、受信部５０は、受信
部３０と同様に、受信した電子メールが音質データを含
む場合には、電子メールから音質データ（ＶＦ）を分離
し、ボイスフォントデータベース部３３０に対して出力
する。また、受信部５０は、必要に応じてＤＴＭＦレシ
ーバをさらに含み、電話機６から通信網２０ｃを介し
て、ディジタルデータあるいはＤＴＭＦの形式で入力さ
れるユーザーＩＤ、パスワード（ＰＷ）、および、電子
メールサーバー５に対してテキストの音声出力を指示す
る操作データ等を受信して、再生制御部５４に対して出
力する。

【００９３】［電子メールデータベース５２］電子メー
ルデータベース５２は、受信部５０から入力された電子
メールのテキストおよびヘッダを記憶・管理し、再生制
御部５４の制御に応じて、記憶した電子メールのテキス
トをテキスト解析部３２０に対して出力し、電子メール
のヘッダに含まれる送信元ＩＤをボイスフォント切替部
３２６に対して出力する。

【００９４】［再生制御部５４］再生制御部５４は、受
信部５０からテキストの音声出力を指示する操作データ
が入力されると、一緒に入力されるユーザーＩＤとパス
ワードとの対応を検査し、ユーザーＩＤとパスワードと
の対応が正しい場合にのみ、電子メールデータベース５
２を制御して、入力されたユーザーＩＤを送信先アドレ
スとしてヘッダに含む電子メールを検索させ、検索の結
果として発見された電子メールをテキスト解析部３２０
およびボイスフォント切替部３２６に対して出力させ
る。また、再生制御部５４は、送信部５６を制御し、音
声合成部３２および送信部５６が生成した音声信号を、
通信網２０ｃを介して電話機６あるいは他の端末装置３
に対して送信させる。

【００９５】［送信部５６］送信部５６は、端末装置３
における音声出力部３８および送信部４４に対応し、音
声通信可能なＴＡの送信部あるいはアナログ電話回線イ
ンターフェースの送信部を含み、再生制御部５４の制御
に従って、音声出力部３８と同様に、音声生成部３２４
から入力される音声素片および音声特徴データから、電
子メールのテキストの内容を送信元ＩＤそれぞれに対応
する音質で読み上げる音声信号を生成し、送信部４４と
同様に通信網２０ｃを介して電話機６に対して送信す
る。

【００９６】［電子メールサーバー５の動作］以下、端
末装置３ｃ−１が送信した電子メールを電子メールサー
バー５が記憶・管理し、電話機６に対するユーザーの操
作に応じて音声出力する場合を例に、通信ネットワーク
２ｃの動作を説明する。

【００９７】［電子メールの受信］通信ネットワーク２
ｃにおいて、端末装置３ｃ−１が通信網２０ｃを介して
電子メールサーバー５に対して電子メールを送信する
と、電子メールサーバー５の受信部５０は、通信網２０
ｃを介して入力される電子メールを受信して、電子メー
ルデータベース５２に対して出力する。電子メールデー
タベース５２は、入力された電子メールを記憶・管理す
る。

【００９８】［テキストの音声出力］電話機６のユーザ
ーは、電話機６から電子メールサーバー５に対して発呼
し、電話機６と電子メールサーバー５との間に通話路を
設定する。さらに、ユーザーは電話機６のテンキーを操
作し、電子メールサーバー５に対して電子メールの読み
上げを要求する符号（操作データ）を入力し、さらに、
続いて、電子メールサーバー５が受信した電子メールに
含まれるユーザーＩＤ（送信先ＩＤ）、および、この送
信先ＩＤに対応付けられて予め電子メールサーバー５の
再生制御部５４に設定されているパスワードを入力す
る。電話機６は、ユーザーの操作に応じて、操作デー
タ、ユーザーＩＤおよびパスワードを、ＤＴＭＦあるい
はディジタルデータの形式で通信網２０を介して電子メ
ールサーバー５に対して送信する。

【００９９】電子メールサーバー５の受信部５０は、電
話機６から入力される操作データ、ユーザーＩＤおよび
パスワードに基づいて電子メールデータベース５２に記
憶されている端末装置３ｃ−１からの電子メールを検索
し、電子メールデータベース５２を制御して、検索の結
果として見つけた電子メールのテキストを、音声合成部
３２のテキスト解析部３２０に対して出力させ、ヘッダ
に含まれる送信元ＩＤをボイスフォント切替部３２６に
対して出力させる。音声合成部３２および送信部５６
は、電子メールデータベース５２から入力されたテキス
トの内容を、ヘッダ内の送信元ＩＤに対応する音質デー
タの音質で読み上げる音声信号を生成し、通信網２０ｃ
を介して電話機６に対して送信する。電話機６は、通信
網２０ｃを介して端末装置３ｃ−１から受信した音声信
号を、ユーザーに対して出力する。

【０１００】以上説明したように、通信ネットワーク２
ｃによれば、ユーザーに対して音声メールシステム１
（図１）においてと同様な電子メールのテキストの音声
出力機能を提供するとともに、音声合成機能等を有さな
い一般的な電話機６に対しても、ユーザーそれぞれに個
別の音質データを用いたテキストの音声出力機能を提供
することができる。

【０１０１】なお、通信ネットワーク２ｃにおける端末
装置３による電子メールサーバー５に対する通信網２０
ｃを介した音質データの設定は、音声メールシステム１
における端末装置３の間の音質データの設定と同様であ
る。また、以上の第２の実施形態の動作説明において
は、端末装置３ｃ−１と、電子メールサーバー５と、電
話機６との間で通信を行なう場合について説明を行なっ
たが、端末装置３ｃ−１〜３ｃ−ｐのいずれかと、電子
メールサーバー５と、電話機６との間でも同様な通信が
可能である。

【０１０２】また、第２の実施形態に示した電子メール
サーバー５は、複数の通信ネットワークの間で共用され
うる。また、通信ネットワーク２ｃにおける電話機６の
台数は１台に限らず、複数の電話機６を通信ネットワー
ク２ｃに接続することができ、また、端末装置３に操作
データ、ユーザーＩＤおよびパスワードの送信機能およ
び音声通信機能を付加することにより、電子メールサー
バー５の電話機６に対する機能を端末装置３に対しても
提供することができる。また、ここで述べた他、通信ネ
ットワーク２ｃに対しては、例えば、電子メールデータ
ベース５２および受信部５０が電子メール全体を出力
し、送信元ＩＤおよび送信先ＩＤもテキストとともに音
声出力するように構成を変形する等、音声メールシステ
ム１に対してと同様な変形が可能であり、さらに、音声
メールシステム１への電子メールサーバー５の付加、あ
るいは、音声メールシステム１と通信ネットワーク２ｃ
との接続等、音声メールシステム１と通信ネットワーク
システム２ｃとを組み合わせることが可能である。

【０１０３】［第３実施形態］以下、本発明の第３の実
施形態を説明する。第１の実施形態および第２の実施形
態に示した音声メールシステムによれば、メールの送信
者それぞれに固有の音質でメールを音声出力することが
できる。しかしながら、上記音声メールシステムにおい
て、音質データを他人の端末装置に設定すると、その管
理および利用の制限は難しく、第三者の勝手な使用（例
えば悪戯等の不正使用）により音質データの作成者が不
利益を被る可能性がある。

【０１０４】また、例えば、本人の誤操作により、ある
いは、第三者の勝手な利用により、カジュアルな調子の
音質データが設定された顧客の端末装置に対して電子メ
ールを送ると、顧客に対して不適切な調子で電子メール
が音声出力されてしまう。このような場合であっても、
他人の端末装置を操作して音質データの変更・削除を行
なうことは不適切であり、他の何らかの適切な方法で音
質データの使用可能範囲を制限する必要がある。本発明
の第３の実施形態は、上述した不具合を防ぐ観点から、
音質データの有効期限および音質データの使用範囲を制
限できるように音質データおよびボイスフォント切替部
３２６の動作を拡張したものである。

【０１０５】［音質データの拡張］第３の実施形態にお
いては、第１の実施形態において表１に示した音質デー
タのヘッダデータ（図１）に、端末装置３が一般的なコ
ンピュータの機能として有する時計機能を利用した使用
期限を定めた音質データの使用、および、電子メールの
送信先ＩＤ（図３）による音質データの使用制限を可能
とする下表２に示す各データがさらに付加される。

【０１０６】

【表２】（表２；音質データのヘッダデータに付加されたデー
タ） TCHAR szReceiverMailID[TSSI_MAILIDLEN]; WORD wLimitFlag; TCHAR szExpireDate[TSSI_DATELEN] 但し、 "szReceiverMailID（制限対象／非制限対象ＩＤ）"は、
複数の送信先ＩＤ（図３）を設定することができ、ここ
に設定された送信先ＩＤを含む電子メールが、送信元Ｉ
Ｄによる音質データの使用制限の対象とされる。"wLimi
tFlag（制限方法フラグ）"には、"VFLIMIT_OR","VFLIMI
T_XOR"の２種類があり、"VFLIMIT_OR"は、"szReceiverM
ailID（制限対象／非制限対象ＩＤ）"として設定された
送信先ＩＤに対してのみ音質データを使用不可とし、"V
FLIMIT_XOR"は、"szReceiverMailID（制限対象／非制限
対象ＩＤ）"として設定された送信先ＩＤ以外に対して
のみ音質データを使用不可とする。"szExpireDate（期
限データ）"は、例えば、19971231（1997年12月31日）
というように設定され、音質データの有効期限を示
す。"szExpireDate（期限データ）"の設定がない場合に
は、音質データの有効期間が無制限であることを示す。

【０１０７】［音質データの使用制限を行なう場合の音
声メールシステム１の動作］以下、図７を参照して、音
声メールシステム１（図１）において、端末装置３ｂ−
１が、端末装置３ａ−１から電子メールを受信し、使用
制限付で音質データを用いて電子メールのテキストを音
声出力する場合の動作を説明する。図７は、端末装置３
（３ｂ−１；図１，図３）が、音質データを使用制限付
きで用いた音声出力処理を行なう場合を示すフローチャ
ート図である。

【０１０８】図７に示すように、ステップ２００（Ｓ２
００）において、端末装置３ｂ−１の受信部３０は、通
信網２０ａ，２０ｂを介して端末装置３ａ−１から電子
メールを受信し、受信した電子メールを開き、電子メー
ルのヘッダから送信元ＩＤ、送信先ＩＤおよび電子メー
ルの送信時刻（送信の年月日・時分）を分離してボイス
フォント切替部３２６に対して出力し、テキストを分離
して音声合成部３２のテキスト解析部３２０に対して出
力する。

【０１０９】ステップ２０２（Ｓ２０２）において、ボ
イスフォント切替部３２６は、受信部３０から入力され
た送信元ＩＤ、送信先ＩＤおよび送信時刻を取得する。

【０１１０】ステップ２０４（Ｓ２０４）において、ボ
イスフォント切替部３２６は、音質データの切り替えを
ボイスフォント検索部３２８に対して指示する。

【０１１１】ステップ２０６（Ｓ２０６）において、ボ
イスフォント切替部３２６は、韻律制御部３２２および
音声生成部３２４に、音声出力処理用に設定され、使用
可能な状態になっている音質データが、現在使用中の音
質データであるか否かを判断し、現在使用中の音質デー
タである場合にはＳ２１４の処理に進み、現在使用中の
音質データでない場合にはＳ２０８の処理に進む。

【０１１２】ステップ２０８（Ｓ２０８）において、ボ
イスフォント切替部３２６は、ボイスフォント検索部３
２８を制御し、受信部３０から入力された送信元ＩＤに
対応する音質データが、ボイスフォントデータベース部
３３０内に存在するか否かを検索させる。

【０１１３】ステップ２１０（Ｓ２１０）において、ボ
イスフォント切替部３２６は、ボイスフォント検索部３
２８の検索結果に基づいて、ボイスフォントデータベー
ス部３３０内に送信元ＩＤに対応する音質データがある
か否かを判断し、送信元ＩＤに対応する音質データがあ
る場合にはＳ２１２の処理に進み、送信元ＩＤに対応す
る音質データがない場合にはＳ２２４の処理に進む。

【０１１４】ステップ２１２（Ｓ２１２）において、ボ
イスフォント切替部３２６は、ボイスフォント検索部３
２８を制御して、ボイスフォントデータベース部３３０
から送信元ＩＤに対応する音質データを、韻律制御部３
２２および音声生成部３２４に供給させて使用可能にす
るとともに、それまで使用していた音質データの代わり
に、ボイスフォント検索部３２８の検索の結果として得
られた送信元ＩＤに対応する音質データを切り替えて用
いるように、韻律制御部３２２および音声生成部３２４
を制御する。

【０１１５】ステップ２１４（Ｓ２１４）において、ボ
イスフォント切替部３２６は、使用可能な状態になって
いる音質データのヘッダデータの制限対象／非制限対象
データ（表２）の部分を参照し、送信先ＩＤが設定され
ているか否かを判断し、制限対象／非制限対象データに
送信先ＩＤが設定されている場合にはＳ２１６の処理に
進み、設定されていない場合にはＳ２２２の処理に進
む。

【０１１６】ステップ２１６（Ｓ２１６）において、ボ
イスフォント切替部３２６は、え３ｂ−１の電子メール
アドレスが、制限対象／非制限対象データに設定された
送信先ＩＤのいずれかと一致するか否かを判断し、一致
する場合にはＳ２１８の処理に進み、一致しない場合に
はＳ２２０の処理に進む。

【０１１７】ステップ２１８（Ｓ２１８）において、ボ
イスフォント切替部３２６は、音質データのヘッダデー
タの制限方法フラグを判断し、制限方法フラグがVFLIMI
T_XORである場合にはＳ２２２の処理に進み、VFLIMIT_X
ORでない場合（VFLIMIT_OR出ある場合にはＳ２２４の処
理に進む。

【０１１８】ステップ２２０（Ｓ２２０）において、ボ
イスフォント切替部３２６は、音質データのヘッダデー
タの制限方法フラグを判断し、制限方法フラグがVFLIMI
T_XORである場合にはＳ２２４の処理に進み、VFLIMIT_X
ORでない場合（VFLIMIT_OR出ある場合にはＳ２２２の処
理に進む。

【０１１９】ステップ２２２（Ｓ２２２）において、ボ
イスフォント切替部３２６は、音質データの期限データ
と、端末装置３ｂ−１のシステムが提供する時計機能が
示す現在の年月日とを比較し、現在の年月日が期限デー
タが示す有効期限の範囲内であればＳ２２８の処理に進
み、範囲外であればＳ２２４の処理に進む。

【０１２０】ステップ２２４（Ｓ２２４）において、ボ
イスフォント切替部３２６は、使用可能な状態にある
（使用中の）音質データがデフォルトの音質データであ
るか否かを判断し、使用中の音質データがデフォルトの
音質データである場合にはＳ２２８の処理に進み、デフ
ォルトの音質データでない場合にはＳ２２６の処理に進
む。

【０１２１】ステップ２２６（Ｓ２２６）において、ボ
イスフォント切替部３２６は、ボイスフォント検索部３
２８を制御して、ボイスフォントデータベース部３３０
からデフォルトの音質データを、韻律制御部３２２およ
び音声生成部３２４に供給させるとともに、それまで使
用していた音質データの代わりに、デフォルトの音質デ
ータを切り替えて用いるように、韻律制御部３２２およ
び音声生成部３２４を制御する。

【０１２２】ステップ２２８（Ｓ２２８）およびステッ
プ２３０（Ｓ２３０）において、韻律制御部３２２およ
び音声生成部３２４は、ボイスフォント切替部３２６の
制御に従って、全てのテキストの内容の出力が終了する
まで、テキスト解析部３２０が生成した発音データに、
処理に使用するように設定されている音質データの音声
素片を対応付け、さらに、音声特徴データを付加して音
声出力部３８に対して出力する。音声出力部３８は、音
声生成部３２４から入力された音声素片が示す音質、お
よび、音声特徴データが示す特徴を有する音声信号を合
成し、外部に出力する。

【０１２３】なお、第３の実施形態は、音声メールシス
テム１（図１；第１の実施形態）において、使用制限付
きで音質データを用いてテキストを音声出力する場合を
説明したが、第３の実施形態に示した使用制限付きで音
質データを用いてテキストを音声出力する方法は、通信
ネットワーク２ｃ（図５；第２実施形態）に対しても応
用可能であることはいうまでもない。

【０１２４】また、以上、音質データの使用期限を日単
位で設定する場合を示したが、第３の実施形態に示した
音声出力方法は、使用期限を時・分等の他の単位ごとに
設定し、設定した単位で使用期限を管理するように変形
することができる。また、以上、音質データの使用期限
の終了時のみを音質データに設定する場合を示したが、
第３の実施形態に示した音声出力方法は、使用期限の開
始時と終了時とを設定し、設定した範囲内のみで音質デ
ータを使用可能とするように変形することができる。ま
た、第３の実施形態に示した音声出力方法に対しても、
第１の実施形態および第２の実施形態に示した変形例と
同様な変形が可能である。

【０１２５】

【発明の効果】上述したように、本発明にかかる音声メ
ールシステム、音声合成装置およびこれらの方法によれ
ば、電子メールの音声出力の際の音質の設定が容易で、
しかも、電子メーを送信したユーザーそれぞれに固有の
音質でテキストを音声出力することができる。

【０１２６】また、本発明にかかる音声メールシステ
ム、音声合成装置およびこれらの方法によれば、電子メ
ールそれぞれに音声出力の際の音質を示すデータ（音質
データ）を付加しなくとも、電子メールを送信したユー
ザーそれぞれに固有の音質でテキストを音声出力するこ
とができる。また、本発明にかかる音声メールシステ
ム、音声合成装置およびこれらの方法によれば、任意の
数の送信元ＩＤで共有することができ、例えば、同一の
ユーザーが複数のＩＤを有する場合であっても、同一の
音質データを複数、登録することに起因する端末装置の
資源の無駄使いを防ぐことができ、多くの音質データを
各端末装置に登録することができる。

【０１２７】また、本発明にかかる音声メールシステ
ム、音声合成装置およびこれらの方法によれば、本発明
は、音質データをネットワーク内に広めてしまっても、
その利用を一定期間内に制限することができ、第３者の
勝手な使用による作成者の不利益の発生を防ぐことがで
きる。

【０１２８】また、本発明にかかる音声メールシステ
ム、音声合成装置およびこれらの方法によれば、音質デ
ータの不適切な使用を防ぐために、音質データの使用可
能範囲を制限することができる。

【図面の簡単な説明】

【図１】本発明の第１の実施形態として示す音声メール
システムの構成図である。

【図２】図１に示した端末装置の構成を示す図である。

【図３】図１および図２に示した端末装置の間で伝送さ
れる電子メールの構成を示す図である。

【図４】図１および図２に示した端末装置の音声出力処
理を示すフローチャート図である。

【図５】本発明の第２の実施形態として示す通信ネット
ワークの構成を示す図である。

【図６】図５に示した音声メールサーバの構成を示す図
である。

【図７】端末装置が、音質データを使用制限付きで用い
た音声出力処理を行なう場合を示すフローチャート図で
ある。

【符号の説明】

１・・・音声メールシステム２ａ〜２ｃ・・・通信ネットワーク２０ａ〜２０ｃ・・・通信網２２ａ−１〜２２ｃ−２・・・ゲートウェイプロセッサ３ａ−１〜３ｃ−ｐ，３・・・端末装置３０・・・受信部３２・・・音声合成部３２０・・・テキスト解析部３２２・・・韻律制御部３２４・・・音声生成部３２６・・・ボイスフォント切替部３２８・・・ボイスフォント検索部３３０・・・ボイスフォントデータベース部３４・・・ボイスフォント入力部３６・・・ボイスフォント生成装置３８・・・音声出力部４０・・・入力装置４２・・・送信・制御部４４・・・送信部５・・・電子メールサーバー５０・・・受信部５２・・・電子メールデータベース５４・・・再生制御部５６・・・送信部６・・・電話機

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩＧ１０Ｌ 19/00 Ｇ１０Ｌ 3/00 ＱＨ０４Ｌ 12/54 Ｎ 12/58 Ｈ０４Ｌ 11/20 １０１ＢＨ０４Ｍ 3/42 (72)発明者斎藤隆神奈川県大和市下鶴間1623番地14 日本アイ・ビー・エム株式会社大和事業所内 (56)参考文献特開平５−260082（ＪＰ，Ａ) 特開平８−272587（ＪＰ，Ａ) 特開平９−50286（ＪＰ，Ａ) 特開平４−177299（ＪＰ，Ａ) 特開平４−175049（ＪＰ，Ａ) 特開平５−233565（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) G10L 13/06 G10L 13/00

Claims

(57)【特許請求の範囲】

【請求項１】ネットワークを介して接続された複数の端
末装置を通信ノードとして含む音声メールシステムであ
って、前記端末装置それぞれは、複数の音声それぞれの音質を示す前記音質データそれぞ
れを、それぞれネットワーク内でユニークな識別子と対
応付けて管理する音質データ管理手段と、少なくとも通信文および前記識別子を含むメールを受信
するメール受信手段と、受信した前記メールが含む前記識別子と対応付けて管理
した前記音質データが示す音質で、受信した前記メール
が含む通信文の内容を示す音声を合成する音声合成手段
と、合成した前記音声を出力する音声出力手段とを有し、前記音質データ管理手段における１の前記音質データに
対応付ける前記識別子の数を複数とすることが可能であ
る音声メールシステム。
【請求項２】ネットワークを介して接続された１つ以上
の端末装置と１つ以上の音声メールサーバー装置とを通
信ノードとして含む音声メールシステムであって、前記音声メールサーバー装置は、複数の音声それぞれの音質を示す前記音質データそれぞ
れを、それぞれネットワーク内でユニークな識別子と対
応付けて管理する音質データ管理手段と、少なくとも通信文および前記識別子を含むメールを受信
するメール受信手段と、受信した前記メールが含む前記識別子と対応付けて管理
した前記音質データが示す音質で、受信した前記メール
が含む通信文の内容を示す音声を合成する音声合成手段
と、前記複数の端末装置のいずれかからの要求に応じて、合
成した前記音声を前記複数の端末装置のいずれかに対し
て出力する音声出力手段とを有し、前記音質データ管理手段における１の前記音質データに
対応付ける前記識別子の数を複数とすることが可能であ
る音声メールシステム。
【請求項３】前記端末装置それぞれは、前記メールを、前記ネットワークを介して他の通信ノー
ドに対して送信するメール送信手段を有する請求項１ま
たは２に記載の音声メールシステム。
【請求項４】前記メールは、少なくとも通信文および送
信元の前記識別子を含み、前記音声合成手段は、受信した前記メールが含む送信元
の前記識別子と対応付けた前記音質データが示す音質
で、受信した前記メールが含む通信文の内容を示す音声
を合成する請求項１〜３のいずれかに記載の音声メール
システム。
【請求項５】入力される音声それぞれの音質を示す音質
データを抽出し、それぞれ前記ネットワーク内でユニー
クな識別子と対応付けて、前記ネットワークを介して前
記通信ノードそれぞれに送信する音質データ抽出手段を
さらに有し、前記音質データ管理手段は、前記ネットワークを介して
前記抽出した音質データそれぞれを受信し、受信した前
記音質データを、それぞれネットワーク内でユニークな
識別子と対応付けて管理し、前記音質データ抽出手段および前記音質データ管理手段
における１の前記音質データに対応付ける前記識別子の
数を複数とすることが可能である請求項１〜４のいずれ
かに記載の音声メールシステム。
【請求項６】前記通信ノードそれぞれは、動作時刻を計
る時計手段を有し、前記音質データそれぞれは、当該音質データの使用期限
を示す期限データを含み、前記音声合成手段は、前記通信ノードの動作時刻が、前
記音質データに含まれる前記期限データが示す使用期限
内である場合にのみ、前記音質データを用いて音声を合
成する請求項１〜５のいずれかに記載の音声メールシス
テム。
【請求項７】前記メールは送信先の識別子を含み、前記音質データそれぞれは、当該音質データの使用を許
可する送信先の識別子を示す使用許可データを含み、前記音声合成手段は、前記メールに含まれる送信先の識
別子が、前記使用許可データが使用を許可する送信先の
識別子である場合に、前記音質データを用いて音声を合
成する請求項１〜６に記載の音声メールシステム。
【請求項８】少なくとも通信文および前記識別子を含む
メールの通信文の音声を合成する音声合成装置であっ
て、複数の音声それぞれの音質を示す音質データそれぞれ
を、それぞれ前記メールを伝送するネットワーク内でユ
ニークな識別子と対応付けて管理する音質データ管理手
段と、前記識別子と対応付けて管理した前記音質データが示す
音質で、受信した前記メールが含む通信文の内容を示す
音声を合成する音声合成手段と前記音質データ管理手段
における１の前記音質データに対応付ける前記識別子の
数を複数とすることが可能であるを有する音声合成装
置。
【請求項９】複数の音声それぞれの音質を示す前記音質
データそれぞれを、それぞれネットワーク内でユニーク
な識別子と対応付けて管理し、少なくとも通信文および前記識別子を含むメールを受信
し、受信した前記メールが含む前記識別子と対応付けた前記
音質データが示す音質で、受信した前記メールが含む通
信文の内容を示す音声を合成し、合成した前記音声を出力する前記音質データの管理にお
ける１の前記音質データに対応付ける前記識別子の数を
複数とすることが可能である音声メール通信方法。
【請求項１０】少なくとも通信文および前記識別子を含
むメールの通信文の音声を合成する音声合成方法であっ
て、複数の音声それぞれの音質を示す音質データそれぞれ
を、それぞれ前記メールを伝送するネットワーク内でユ
ニークな識別子と対応付けて管理し、前記識別子と対応付けて管理した前記音質データが示す
音質で、受信した前記メールが含む通信文の内容を示す
音声を合成する前記音質データの管理における１の前記
音質データに対応付ける前記識別子の数を複数とするこ
とが可能であるを有する音声合成方法。
【請求項１１】複数の音声それぞれの音質を示す前記音
質データそれぞれを、それぞれネットワーク内でユニー
クな識別子と対応付けて管理するステップと、少なくとも通信文および前記識別子を含むメールを受信
するステップと、受信した前記メールが含む前記識別子と対応付けた前記
音質データが示す音質で、受信した前記メールが含む通
信文の内容を示す音声を合成するステップと、をコンピュータに実行させるプログラムを記録し、前記プログラムの前記音質データを管理するステップに
おける１の音質データに対応付ける識別子の数を複数と
することが可能であるコンピュータ読み取り可能な記録
媒体。