JP3224760B2 - 音声メールシステム、音声合成装置およびこれらの方法 - Google Patents

音声メールシステム、音声合成装置およびこれらの方法

Info

Publication number
JP3224760B2
JP3224760B2 JP18469197A JP18469197A JP3224760B2 JP 3224760 B2 JP3224760 B2 JP 3224760B2 JP 18469197 A JP18469197 A JP 18469197A JP 18469197 A JP18469197 A JP 18469197A JP 3224760 B2 JP3224760 B2 JP 3224760B2
Authority
JP
Japan
Prior art keywords
voice
sound quality
mail
quality data
identifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP18469197A
Other languages
English (en)
Other versions
JPH1138996A (ja
Inventor
下 七 郎 宮
藤 隆 斎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP18469197A priority Critical patent/JP3224760B2/ja
Priority to US09/097,867 priority patent/US6289085B1/en
Publication of JPH1138996A publication Critical patent/JPH1138996A/ja
Application granted granted Critical
Publication of JP3224760B2 publication Critical patent/JP3224760B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/033Voice editing, e.g. manipulating the voice of the synthesiser
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/64Automatic arrangements for answering calls; Automatic arrangements for recording messages for absent subscribers; Arrangements for recording conversations
    • H04M1/65Recording arrangements for recording a message from the calling party
    • H04M1/6505Recording arrangements for recording a message from the calling party storing speech in digital form
    • H04M1/651Recording arrangements for recording a message from the calling party storing speech in digital form with speech synthesis

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Information Transfer Between Computers (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Computer And Data Communications (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、電子メールのテキスト
の内容を、例えば、電子メールを送信した人それぞれに
固有の音質の音声で読み上げる音声メールシステム、音
声合成装置およびこれらの方法に関する。
【0002】
【従来の技術】電子メールのテキストの内容を音声出力
する音声メールシステムが用いられている。かかる音声
メールシステムとして、例えば、特開平5−26008
2号公報(文献1)は、受信側端末が、送信元の識別子
(ID)に対応付けられた母音の音素を用いてテキスト
を音声出力する第1のテキスト読み上げ装置と、送信側
端末が、電子メールに、パラメータを含めて送信し、受
信側端末が、受信したパラメータを用いてテキストを音
声出力する第2のテキスト読み上げ装置とを開示する。
【0003】しかしながら、文献1に開示された第1の
テキスト読み上げ装置は、端末装置それぞれにおいて音
声素片と送信側IDとを対応付けて登録する必要がある
ので、音声素片の設定に手間がかかり、しかも、一旦、
各端末に音声素片を設定すると、その変更は難しい。ま
た、第1のテキスト読み上げ装置は、電子メールの送信
元IDに応じて母音のみの音声素片を選択し、テキスト
の音声出力を行うので、子音を含めた形で、電子メール
を送信したユーザーそれぞれに固有な音質でテキストを
音声出力することはできない。
【0004】また、第1のテキスト読み上げ装置は、1
つの音声素片に対して、送信元IDを1つだけしか対応
付けることができないので、例えば、複数のIDを有す
る電子メールを送信したユーザーが、いずれのIDを用
いた場合にも、テキストを同一の音質で音声出力させよ
うとすると、各端末装置に、同一内容の音声素片を複数
ずつ、送信元IDのみを変更して登録する必要があり、
端末装置の資源が無駄になり、登録可能な音声素片の数
が少なくなってしまう。
【0005】また、文献1に開示された第2のテキスト
読み上げ装置は、送信側端末が、電子メールそれぞれ
に、電子メールを送信したユーザーの母音の音声素片お
よび声のピッチ等を示すデータを含めて送信するので、
電子メールのデータ量が増大し、通信ネットワークに輻
輳を生じさせる可能性がある。
【0006】また、音質データをネットワーク内の各端
末に一旦、広めてしまうと、その利用の制限がしずら
く、第3者により勝手に使用されて音質データの作成者
に不利が生じることがある。
【0007】また、例えば、顧客の端末装置にカジュア
ルな調子の音質データが記憶されている可能性がある場
合に、顧客に対してメールがカジュアルな調子で音声出
力されるという不適切な事態の発生を防ぐといったよう
に、音質データの使用可能範囲を制限したい場合があ
る。
【0008】
【発明が解決しようとする課題】本発明は、上述した従
来技術の問題点に鑑みてなされたものであり、電子メー
ルの音声出力の際の音質の設定が容易で、しかも、電子
メールを送信したユーザーそれぞれに固有の音質でテキ
ストを音声出力することができる音声メールシステム、
音声合成装置およびこれらの方法を提供することを目的
とする。
【0009】また、本発明は、電子メールそれぞれに音
声出力の際の音質を示すデータ(音質データ)を付加し
なくとも、電子メールを送信したユーザーそれぞれに固
有の音質でテキストを音声出力することができる音声メ
ールシステム、音声合成装置およびこれらの方法を提供
することを目的とする。また、本発明は、音質データそ
れぞれを、任意の数の送信元IDで共有することがで
き、例えば、同一のユーザーが複数のIDを有する場合
であっても、同一の音質データを複数、登録することに
起因する端末装置の資源の無駄使いを防ぐことができ、
多くの音質データを各端末装置に登録することができる
音声メールシステム、音声合成装置およびこれらの方法
を提供することを目的とする。
【0010】また、本発明は、音質データをネットワー
ク内に広めてしまっても、その利用を一定期間内に制限
することができ、第3者の勝手な使用による作成者の不
利益の発生を防ぐことができる音声メールシステム、音
声合成装置およびこれらの方法を提供することを目的と
する。
【0011】また、本発明は、音質データの不適切な使
用を防ぐために、音質データの使用可能範囲を制限する
ことができる音声メールシステム、音声合成装置および
これらの方法を提供することを目的とする。
【0012】
【課題を達成するための手段】上記目的を達成するため
に、本発明にかかる音声メールシステムの一態様(第1
の音声メールシステム)は、ネットワークを介して接続
された複数の端末装置を通信ノードとして含む音声メー
ルシステムであって、前記端末装置それぞれは、複数の
音声それぞれの音質を示す前記音質データそれぞれを、
それぞれネットワーク内でユニークな1つ以上の識別子
と対応付けて管理する音質データ管理手段と、少なくと
も通信文および前記識別子を含むメールを受信するメー
ル受信手段と、受信した前記メールが含む前記識別子と
対応付けて管理した前記音質データが示す音質で、受信
した前記メールが含む通信文の内容を示す音声を合成す
る音声合成手段と、合成した前記音声を出力する音声出
力手段とを有する。
【0013】また、本発明にかかる音声メールシステム
の他の一態様(第2の音声メールシステム)は、ネット
ワークを介して接続された1つ以上の端末装置と1つ以
上の音声メールサーバー装置とを通信ノードとして含む
音声メールシステムであって、前記音声メールサーバー
装置は、複数の音声それぞれの音質を示す前記音質デー
タそれぞれを、それぞれネットワーク内でユニークな1
つ以上の識別子と対応付けて管理する音質データ管理手
段と、少なくとも通信文および前記識別子を含むメール
を受信するメール受信手段と、受信した前記メールが含
む前記識別子と対応付けて管理した前記音質データが示
す音質で、受信した前記メールが含む通信文の内容を示
す音声を合成する音声合成手段と、前記複数の端末装置
のいずれかからの要求に応じて、合成した前記音声を前
記複数の端末装置のいずれかに対して出力する音声出力
手段とを有する。
【0014】また、本発明にかかる音声メールシステム
の他の一態様において、前記端末装置それぞれは、前記
メールを、前記ネットワークを介して他の通信ノードに
対して送信するメール送信手段を有する。
【0015】また、本発明にかかる音声メールシステム
の他の一態様において、前記メールは、少なくとも通信
文および送信元の前記識別子を含み、前記音声合成手段
は、受信した前記メールが含む送信元の前記識別子と対
応付けた前記音質データが示す音質で、受信した前記メ
ールが含む通信文の内容を示す音声を合成する。
【0016】また、本発明にかかる音声メールシステム
の他の一態様は、入力される音声それぞれの音質を示す
音質データを抽出し、それぞれ前記ネットワーク内でユ
ニークな1つ以上の識別子と対応付けて、前記ネットワ
ークを介して前記通信ノードそれぞれに送信する音質デ
ータ抽出手段をさらに有し、前記音質データ管理手段
は、前記ネットワークを介して前記抽出した音質データ
それぞれを受信し、受信した前記音質データを、それぞ
れネットワーク内でユニークな1つ以上の識別子と対応
付けて管理する。
【0017】また、本発明にかかる音声メールシステム
の他の一態様において、前記通信ノードそれぞれは、動
作時刻を計る時計手段を有し、前記音質データそれぞれ
は、当該音質データの使用期限を示す期限データを含
み、前記音声合成手段は、前記通信ノードの動作時刻
が、前記音質データに含まれる前記期限データが示す使
用期限内である場合にのみ、前記音質データを用いて音
声を合成する。
【0018】また、本発明にかかる音声メールシステム
の他の一態様において、前記メールは送信先の識別子を
含み、前記音質データそれぞれは、当該音質データの使
用を許可する送信先の識別子を示す使用許可データを含
み、前記音声合成手段は、前記メールに含まれる送信先
の識別子が、前記使用許可データが使用を許可する送信
先の識別子である場合に、前記音質データを用いて音声
を合成する。
【0019】本発明にかかる第1の音声メールシステム
においては、データ通信が可能な電話網、ISDN網、
あるいは、LAN等の通信ネットワークを介して接続さ
れた複数の端末装置が、相互に電子メールを伝送し、受
信した電子メールのテキストを、電子メールを送信した
ユーザーそれぞれに固有の音質で音声出力する。また、
本発明にかかる第2の音声メールシステムにおいては、
複数の端末装置が、上記通信ネットワークを介して接続
された音声メールサーバ装置に対して電子メールを送信
し、音声メールサーバ装置が、端末装置からの要求に応
じて、受信した電子メールのテキストを、電子メールを
送信したユーザーに固有の音質の音声で読み上げ、要求
を出した端末装置に送信する。
【0020】音質データ抽出手段は、例えば、ユーザー
が入力する音声から母音および子音の音声素片を抽出
し、さらに、音声の言語、性別および年齢等を示す音声
特徴データを付加し、通信ネットワークにおいてユニー
クな各ユーザーの識別子(ID)、1つ以上と対応付け
て、ユーザー固有の音声の音質を示すデータ(音声素
片)を、あたかも、ユーザーごとに文字フォントのよう
に取り扱うができるようにした音質データ(ボイスフォ
ント)を生成する。
【0021】上記端末装置および音声メールサーバ装置
は、例えば、音声処理機能を有するコンピュータであっ
て、一般のコンピュータと同様に、動作の日付および時
分(時刻)を計る機能を有する。端末装置または音声メ
ールサーバ装置において、音質データ管理手段は、音質
データ抽出手段が、各ユーザーのIDと対応付けた音質
データを記憶・管理する。メール受信手段は、通信文
(テキスト)、送信元の識別子(電子メールを送信した
ユーザーID)、使用期限(期限データ)および使用可
能な送信先識別子(使用許可データ)等を含み、端末装
置から通信ネットワークを介して送られてくる電子メー
ル、例えば、イントラネットあるいはインターネットに
おける通信で用いられるメールパケットを受信し、電子
メールに含まれるテキストとユーザーのID等とを分離
する。
【0022】音声合成手段は、メール受信手段が分離し
たユーザーIDが示す音質データを、音質データ管理手
段から取得し、取得した音質データが示す音質の音声を
合成し、電子メールのテキストの内容を音声出力する。
さらに、音声合成手段は、音声合成を行なう日付・時分
(時刻)が、音質データに含まれる期限データが示す期
間内である場合にのみ、あるいは、使用許可データが示
す送信先においてのみ、その音質データを有効なものと
して扱って、音声合成に用いることにより、音質データ
の無制限な使用を制限する。
【0023】端末装置において、音声出力手段は、音声
合成手段が合成した音声を、端末装置に設けられたスピ
ーカー等を介して受信側の端末装置のユーザーに対して
出力する。メール送信手段は、他の端末装置または音声
メールサーバ装置に対して、通信ネットワークを介し
て、上記電子メールを送信する。
【0024】また、本発明にかかる第2の音声メールサ
ーバ装置において、音声出力手段は、例えば、メールを
受けたいユーザーが、端末装置のいずれかを操作して音
声メールサーバー装置との間に呼設定を行い、さらに、
ユーザーIDおよびパスワードを入力してメールの配信
を要求した場合に、音声合成手段を制御して、このユー
ザー宛の電子メールのテキストの内容を音声出力させ、
通信ネットワークを介してユーザーが操作する端末装置
に配信する。
【0025】また、本発明にかかる音声合成装置は、少
なくとも通信文および前記識別子を含むメールの通信文
の音声を合成する音声合成装置であって、複数の音声そ
れぞれの音質を示す音質データそれぞれを、それぞれ前
記メールを伝送するネットワーク内でユニークな1つ以
上の識別子と対応付けて管理する音質データ管理手段
と、前記識別子と対応付けて管理した前記音質データが
示す音質で、受信した前記メールが含む通信文の内容を
示す音声を合成する音声合成手段とを有する。
【0026】また、本発明にかかる音声メール通信方法
は、複数の音声それぞれの音質を示す前記音質データそ
れぞれを、それぞれネットワーク内でユニークな1つ以
上の識別子と対応付けて管理し、少なくとも通信文およ
び前記識別子を含むメールを受信し、受信した前記メー
ルが含む前記識別子と対応付けた前記音質データが示す
音質で、受信した前記メールが含む通信文の内容を示す
音声を合成し、合成した前記音声を出力する。
【0027】また、本発明にかかる音声合成方法は、少
なくとも通信文および前記識別子を含むメールの通信文
の音声を合成する音声合成方法であって、複数の音声そ
れぞれの音質を示す音質データそれぞれを、それぞれ前
記メールを伝送するネットワーク内でユニークな1つ以
上の識別子と対応付けて管理し、前記識別子と対応付け
て管理した前記音質データが示す音質で、受信した前記
メールが含む通信文の内容を示す音声を合成する。
【0028】また、本発明にかかるコンピュータ読み取
り可能な記録媒体は、複数の音声それぞれの音質を示す
前記音質データそれぞれを、それぞれネットワーク内で
ユニークな1つ以上の識別子と対応付けて管理するステ
ップと、少なくとも通信文および前記識別子を含むメー
ルを受信するステップと、受信した前記メールが含む前
記識別子と対応付けた前記音質データが示す音質で、受
信した前記メールが含む通信文の内容を示す音声を合成
するステップとをコンピュータに実行させるプログラム
を記録する。
【0029】
【発明の実施の形態】
[第1実施形態]以下、本発明の第1の実施形態を説明
する。
【0030】[音声メールシステム1の構成]以下、本
発明にかかる音声メールシステム1の構成を説明する。
図1は、本発明の第1の実施形態として示す音声メール
システム1の構成図である。図1に示すように、音声メ
ールシステム1は、1つ以上のネットワーク、例えば、
通信ネットワーク2a,2b(ネットワークA,ネット
ワークB)の2つから構成される。通信ネットワーク2
a,2bはそれぞれ、データ伝送が可能なISDN通信
網、電話網およびLAN等の通信網20a,20b、通
信ネットワーク2a,2b、その他のネットワーク(図
示せず)との間を相互接続するゲートウェイプロセッサ
(GWP)22a−1,22a−2,22b−1,22
b−2、および、通信網20a,20bに接続された複
数の端末装置3a−1〜3a−m,3b−1〜3b−n
(m,nは任意の整数、図1はm,n=6の場合を例
示)を通信ノードとして含む。音声メールシステム1
は、これらの構成部分により、複数の端末装置3(以
下、複数の端末装置を、いずれかに特定せずに記す場合
には、端末装置3と略記する)の間で電子メールを伝送
し、電子メールのテキスト部分を音声出力する。
【0031】[端末装置3の構成]以下、端末装置3の
構成を説明する。図2は、図1に示した端末装置3(3
a−1〜3a−6,3b−1〜3b−6)の構成を示す
図である。図3は、図1および図2に示した端末装置3
の間で伝送される電子メールの構成を示す図である。図
2に示すように、端末装置3は、例えば、動作年月日お
よび時分を計る(時計)機能および音声出力機能等を有
するマルチメディアコンピュータであって、受信部(R
X)30、音声合成部32、ボイスフォント(VF; v
oice font)入力部34、ボイスフォント生成装置3
6、音声出力部38、キーボードおよびマウス等を有す
る入力装置40、送信・制御部42および送信部(T
X)44から構成される。なお、図2において、端末装
置3のマルチメディアコンピュータとしての構成部分の
うち、ハードデスク装置およびモニタ装置等、本発明の
説明に直接、関係ないものは省略されている。
【0032】音声合成部32は、テキスト解析部32
0、韻律制御部322、音声生成部324、ボイスフォ
ントデータベース部(VFDB)330、ボイスフォン
ト切替部(VFSW)326、ボイスフォント検索部3
28から構成される。ボイスフォント生成装置36は、
ボイスフォント生成部(VFG)360およびボイスフ
ォント生成制御部(VFGC)362から構成される。
【0033】端末装置3はそれぞれ、これらの構成部分
により、図3に示すように、ヘッダ部分に送信元の識別
子(送信元ID)、送信先ID、経由ノードおよび電子
メール送信の年月日および時分(時刻)等のデータを含
み、メールテキスト部分に通信文(テキスト)を含む電
子メールを、送信データとして通信ネットワーク2a,
2bを介して他の端末装置3に対して送信する。また、
端末装置3はそれぞれ、他の端末装置3から通信ネット
ワーク2a,2bを介して受信データとして受信した電
子メール(図3)のメールテキスト部分に含まれるテキ
ストの内容を、ヘッダ部分に含まれる送信元識別子(I
D)それぞれに対応する音質の音声、例えば、電子メー
ルを送信したユーザーの声で音声出力する。
【0034】[端末装置3の各構成部分]以下、図2に
示した端末装置3の各構成部分を説明する。
【0035】[受信部30]受信部30は、接続されて
いる通信ネットワーク2a,2bが、例えば、ISDN
通信網である場合にはISDN回線アダプタ(TA;te
rminal adapter)の受信部、電話網である場合にはモデ
ムの受信部、LANの場合にはLAN接続ボードの受信
部を含み、通信ネットワーク2a,2bから受信データ
として入力される電子メール(図3)を受信して開き、
開いた電子メールに含まれるテキスト(TEXT)を分離し
てテキスト解析部320に対して出力し、ヘッダ(HEADE
R)に含まれる送信元IDを分離してボイスフォント切替
部326に対して出力する。また、受信部30は、受信
した電子メールが音質データを含む場合には、電子メー
ルから音質データを分離し、ボイスフォントデータベー
ス部330に対して出力する。
【0036】なお、音質データは、例えば、音声メール
システム1の任意のユーザーの声に含まれる母音(日本
語の場合にはa,i,u,e,o)および子音(日本語の場合に
はk,s,t,n,h,m,y,r,w,g,z,d,b,p等)から抽出されるパ
ラメータ(スペクトラムおよび波形情報等)を示す音声
素片に、下表に例示するヘッダデータを付したものであ
って、ヘッダデータには、音声素片を用いて音声を合成
する際に、音声に特徴を与えるために用いられる言語、
個性および年齢等を示す音声特徴データ(language, wGe
nder, wAge等)を含む。また、文字の形を特徴付けるフ
ォントデータと同様に、合成音声の音質を特徴付けるの
で、音質データはボイスフォントとも呼ばれる。
【0037】
【表1】 (表1;音質データのヘッダデータの構造) typedef struct{//ttsmi GUID gEngineID; TCHAR szMfgName [TTSI_NAMELEN]; TCHAR szProductName [TTSI_NAMELEN]; GUID gModeID; TCHAR szModeName [TTSI_NAMELEN]; LANGUAGE language; TCHAR szSpeaker [TTSI_NAMELEN]; TCHAR szStyle [TTSI_NAMELEN]; WORD wGender WORD wAge DWORD dwFeatures DWORD dwInterfaces DWORD dwEngineFeatures TCHAR szMailID [TTSI_MAILIDLEN]; } TISMODEINFO, *PTTSMODEINFO; 但し、GUID, WORD, DWORD, LANGUAGEは、予め定義され
るデータの型を示し、TTSI_NAMELENは、名前の文字列長
を示し、TTSI_MAILIDLENは、MailIDの文字列長の最大値
を示し、 gEngineID :音質データの生成あるいは音声合成を行う
装置(音声合成エンジン)に固有の識別子(ID) szMfgName :装置(エンジン)の製造者の名称(例"zzz Co
rporation") szProductName :装置(エンジン)の名称(例"zzz's vv
v") gModeID :装置に複数の動作モードがある場合の動作モ
ードの識別子(ID) szModeName :音声合成処理に複数の処理モードがある場
合の処理モードの識別子(ID) language :合成する音声の言語(例、Japanese, Englis
h etc.) szSpeaker :音声素片の名称(例えば、電子メールを送信
するユーザー) szStyle :声の個性(例、"Business, Casual, Computer,
Excited, SingSong") wGender :声の性別[例、"GENDER_FEMALE(女性)","G
ENDER_MALE(男性)","GENDER_NEUTRAL(特に女性でも
男性でもない声)"] wAge :声の年齢[例、"TISAGE_BABY(1歳程度)","TI
SAGE_TODDLER(3歳程度)","TISAGE_CHILD(6歳程
度)","TISAGE_ADOLESCENT(14歳程度)","TISAGE_
ADULT(20〜60歳程度)","TISAGE_ELDERLY(約6
0歳以上)"] dwFeatures :装置(エンジン)で利用可能な音声合成機能
の識別子(ID)[例、"TISFERATURE_ANYWORD(任意単語の
読み上げ)","TISFERATURE_IPAUNICODE(Internationa
l Phonetic Alphabet (IPA)発音記号のサポート)","TI
SFERATURE_PCOTIMIZED(音声の質の最適化)","TISFER
ATURE_PHONEOPTIMIZED(8kHzサンプリングレートの電
話網での使用が可能)","TISFERATURE_PITCH(ピッチ
調整)","TISFERATURE_SPEED(スピード調整)","TIS
FERATURE_TAGGED(タグテキストによる制御)","TISFE
RATURE_VISUAL(口の形状情報の提供)","TISFERATURE
_VOLUME(音量調整)","TISFERATURE_WORDPOSITION
(読み上げ中の単語位置の報告)"] dwInterfaces :装置(エンジン)がサポートするインタ
ーフェース[例、"TISI_ILEXPRONOUNCE(ILexPronounce
interface)","TISI_ITTSATTRIBUTES(ITTSAttributes i
nterface)","TISI_ITTSCENTRAL(ITTSCentral interfac
e)","TISI_ITTSDIALOGS(ITTSDialogs interface)",] dwEngineFeatures :装置(エンジン)特有の特徴
[例、"TISFEATURE_SPEED(スピード調整)","TISFERA
TURE_TAGGED(タグテキストによる制御)","TISFERATU
RE_VISUAL(口の形状情報の提供)","TISFERATURE_VOL
UME(音量調整)","TISFERATURE_WORDPOSITION(読み
上げ中の単語位置の報告)"] szMailID :音質データと対応付けられた1つ以上のユー
ザーID[例、同一ユーザーの企業内ネットワーク(イ
ントラネット)ID(xxx/www/zzz)とインターネットID
(xxx @ yyy.zzz.com)] である。
【0038】[音声合成部32]音声合成部32は、受
信部30から入力される電子メール(図3)のヘッダに
含まれる送信元IDに対応する音質データに含まれる音
声素片および音声特徴データを用いてテキストの内容を
示す音声を合成し、出力する。
【0039】[ボイスフォントデータベース部330]
音声合成部32において、ボイスフォントデータベース
部330は、受信部30、ボイスフォント入力部34お
よびボイスフォント生成装置36から入力される音質デ
ータを記憶・管理し、ボイスフォント検索部328の制
御に応じて韻律制御部322、音声生成部324および
送信部44に対して出力する。
【0040】[テキスト解析部320]テキスト解析部
320は、受信部30から入力されるテキストを解析
し、テキストの読みを示すデータを、韻律制御部322
に対して出力する。具体的には、例えば、受信部30か
ら入力されたテキストに日本語の「音声合成」という文
字列が含まれる場合には、テキスト解析部320は、文
字列「オンセイ」を解析して、その読みおよびアクセン
ト「オ・ン・セ・ー・ゴ^・ー・セ・ー」(但し、^は
アクセントの位置を示す)を表す発音データを生成し、
音声生成部324に対して出力する。
【0041】[韻律制御部322]韻律制御部322
は、ボイスフォントデータベース部330から入力さ
れ、ボイスフォント切替部326により切り替えられた
音質データの内、表1に例示したヘッダデータに含まれ
る音声特徴データに基づいて、テキスト解析部320か
ら入力される発音データに、音声の韻律的な特徴を与え
る韻律データを付加し、音声生成部324に対して出力
する。
【0042】[音声生成部324]音声生成部324
は、ボイスフォントデータベース部330から入力さ
れ、ボイスフォント切替部326により切り換えられた
音質データに含まれる音声素片と、テキスト解析部32
0から韻律制御部322を介して入力される発音データ
とを対応付けて、音声出力部38に対して出力する。
【0043】[ボイスフォント切替部326]ボイスフ
ォント切替部326は、受信部30から入力される電子
メール(図3)の送信元IDに基づいて、ボイスフォン
ト検索部328を制御して、ボイスフォントデータベー
ス部330内の音質データを検索させる。さらに、ボイ
スフォント切替部326は、この検索結果に基づいて韻
律制御部322および音声生成部324を、ボイスフォ
ントデータベース部330内に送信元IDに対応する音
質データが存在する場合には、処理に用いる音質データ
を、ボイスフォントデータベース部330から供給され
る送信元IDに対応する音質データに切り替えるよう
に、送信元IDに対応する音質データが存在しない場合
には、処理に用いる音質データを、送信元IDに対応す
る音質データがない場合に用いる音質データ(デフォル
トの音質データ)に切り替えるように制御する。
【0044】[ボイスフォント検索部328]ボイスフ
ォント検索部328は、ボイスフォント切替部326の
制御に応じて、ボイスフォントデータベース部330に
記憶・管理されている音質データを検索し、ボイスフォ
ントデータベース部330を制御して、送信元IDに対
応する音質データが存在する場合には、送信元IDに対
応する音質データを、韻律制御部322および音声生成
部324に供給させ、送信元IDに対応する音質データ
が存在しない場合には、ボイスフォントデータベース部
330を制御して、デフォルトの音質データを、韻律制
御部322および音声生成部324に供給させる。ま
た、ボイスフォント検索部328は、ユーザーが、送信
先IDおよびユーザーIDを入力装置40に入力し、送
信・制御部42に対して他の端末装置3に対して入力し
たユーザーIDに対応する音質データの送信を指示した
場合に、送信・制御部42の制御に応じて、ボイスフォ
ントデータベース部330に記憶・管理されている音質
データを検索し、ユーザーIDに対応する音質データが
存在する場合には、ボイスフォントデータベース部33
0を制御して、ユーザーIDに対応する音質データを送
信部44に供給させる。
【0045】[音声出力部38]音声出力部38は、音
声生成部324により発音データに対応付けられた音声
素片が示す音声を、韻律制御部322により発音データ
に対応付けられた音声特徴データに基づいて特徴付けた
音声信号を生成し、端末装置3に設けられたスピーカ
(SP;図示せず)等を介して出力する。
【0046】[ボイスフォント入力部34]ボイスフォ
ント入力部34は、例えば、フロッピーディスク装置で
あって、フロッピーディスク等の記録媒体340に記録
された音質データを再生し、ボイスフォントデータベー
ス部330に対して出力する。
【0047】[ボイスフォント生成装置36]ボイスフ
ォント生成装置36は、表1に示したヘッダデータを有
する音質データを生成し、ボイスフォントデータベース
部330に対して出力する。なお、ボイスフォント生成
装置36は、受信部30から分離されていてもよく、端
末装置3から分離されたボイスフォント生成装置36が
生成した音質データは、通信網20a,20bあるいは
記録媒体340を介して各端末装置3に供給される。
【0048】[ボイスフォント生成制御部362]ボイ
スフォント生成装置36において、ボイスフォント生成
制御部362は、外部から入力されるユーザーID(表
1に示したszMailID)およびその他のヘッダデータを受
け入れ、ボイスフォント生成部360に対して出力す
る。また、ボイスフォント生成制御部362は、ユーザ
ーの操作に応じてボイスフォント生成部360を制御
し、外部から入力される音声信号からの音声素片の抽
出、および、音質データの生成を行わせる。
【0049】[ボイスフォント生成部360]ボイスフ
ォント生成部360は、ボイスフォント生成制御部36
2の制御に応じて、外部から入力されるユーザー等の音
声信号から音声素片を抽出し、さらに、抽出した音声素
片にボイスフォント生成制御部362から入力されるヘ
ッダデータを付加して音質データを生成し、ボイスフォ
ントデータベース部330に対して出力する。
【0050】[送信・制御部42]送信・制御部42
は、ユーザーが入力装置40に送信先IDおよびテキス
トの内容等を入力し、電子メール(図3)の送信を指示
した場合に、電子メールを生成して、送信部44および
通信ネットワーク2a,2b(図1)を介して送信先の
端末装置3に対して出力する。また、送信・制御部42
は、ユーザーが上述のように音質データの送信を指示し
た場合に、送信部44を制御して音質データをテキスト
として含む電子メールを、他の端末装置3に対して送信
させる。
【0051】[送信部44]送信部44は、接続されて
いる通信ネットワーク2a,2bが、例えば、ISDN
通信網である場合にはISDN回線アダプタ(TA)の
送信部、電話網である場合にはモデムの送信部、LAN
の場合にはLAN接続ボードの送信部を含み、入力装置
40から入力された電子メールを、通信ネットワーク2
a,2bを介して他の端末装置3に対して送信する。ま
た、送信部44は、入力装置40の制御に応じて、音質
データをテキスト内に含む電子メールを生成して、通信
ネットワーク2a,2bを介して他の端末装置3に対し
て送信する。
【0052】[音声メールシステム1の動作]以下、端末
装置3a−1(図1,図2)が音質データを作成し、3
b−1に対して音質データおよび電子メールを送信し、
端末装置3b−1が、端末装置3a−1から受信した電
子メールを、受信した音質データが示す音質で音声出力
する場合を例に、音声メールシステム1の動作を説明す
る。
【0053】[音質データの作成]まず、端末装置3a
−1が音質データを作成する際の動作を説明する。ユー
ザーは、ボイスフォント生成装置36のボイスフォント
生成制御部362に対して所定の操作を行ない、音質デ
ータの作成を指示し、さらに、音声素片に対応付けるユ
ーザーIDおよびその他の音声特徴データ(表1)を入
力する。ボイスフォント生成制御部362は、ユーザー
に対して、例えば、音声およびモニタ表示により、母音
および子音の音声素片の抽出に必要な音声の入力を促す
指示を行ない、さらに、ボイスフォント生成部360を
制御して、ボイスフォント生成部360に対してユーザ
ーの音声を受け入れさせる。
【0054】ユーザーは、ボイスフォント生成制御部3
62による音声の入力を促す指示に応じて発音し、ボイ
スフォント生成制御部362に対してマイク(図示せ
ず)を介して音声を入力し、ボイスフォント生成制御部
362は、入力されたアナログ音声を、ディジタル形式
の音声データに変換し、記憶する。さらに、ボイスフォ
ント生成部360に対する音声の入力が終了すると、ユ
ーザーは、ボイスフォント生成制御部362に対して所
定の操作を行ない、音声入力の終了を通知する。
【0055】ボイスフォント生成部360は、ユーザー
の音声入力の終了の通知に応じてボイスフォント生成制
御部362を制御して、記憶した音声データからケプス
トラムパラメータを抽出させ、音声素片を生成させる。
さらに、ボイスフォント生成部360は、ボイスフォン
ト生成制御部362を制御して、ユーザーIDおよびそ
の他の音声特徴データと、作成した音声素片とを対応付
けさせて音質データを作成させ、ボイスフォントデータ
ベース部330に対して出力させる。ボイスフォントデ
ータベース部330は、ボイスフォント生成制御部36
2から入力された音質データそれぞれをファイルとして
記録し、記録した音質データを管理する。
【0056】[音質データの送信]次に、通信ネットワ
ーク2a内の端末装置3a−1が、通信ネットワーク2
b内の端末装置3b−1およびその他の端末装置3に対
して、メールテキスト部分に音質データを含む電子メー
ル(図3)を送信する際の動作を説明する。まず、端末
装置3a−1のユーザーは、端末装置3a−1の入力装
置40を操作して、送信先(端末装置3b−1およびそ
の他の端末装置3)の電子メールアドレス、および、送
信しようとする音質データを示すユーザーIDを入力
し、端末装置3a−1に対して、音質データの送信を指
示する。
【0057】入力装置40は、ユーザーが入力した電子
メールアドレス、ユーザーIDおよび音質データの送信
の指示を受け入れ、送信・制御部42に対して出力す
る。送信・制御部42は、端末装置3a−1の電子メー
ルアドレスを送信元IDとして、端末装置3b−1およ
びその他の端末装置3の電子メールアドレスを送信先I
Dとして送信部44に対して出力し、音声合成部32の
ボイスフォント検索部328に対して、音質データを示
すユーザーIDを出力し、さらに、ボイスフォント検索
部328を制御して、出力したユーザーIDをヘッダデ
ータ内にszMailID(表1)として含む音質データを検索
させる。
【0058】ボイスフォント検索部328は、送信・制
御部42の制御に応じて、ボイスフォントデータベース
部330が記憶・管理する音質データの内、入力された
ユーザーIDを含む音質データを検索し、ボイスフォン
トデータベース部330を制御して、該当する音質デー
タを送信部44に対して出力させる。送信部44は、送
信・制御部42から入力された送信元IDおよび送信先
IDをヘッダ部分に多重化し、検索の結果として得られ
た音質データをメールテキスト部分に多重化して電子メ
ールを作成し、通信網20a,20bを介して端末装置
3b−1およびその他の端末装置3に対して、個別送信
あるいは同報送信する。
【0059】[音質データの受信]次に、通信ネットワ
ーク2b内の端末装置3b−1が、通信ネットワーク2
a内の端末装置3aが送信した音質データを含む電子メ
ール(図3)を送信する際の動作を説明する。端末装置
3b−1の受信部30は、端末装置3a−1から伝送さ
れてきた音質データを含む電子メールを受信すると、電
子メールのメールテキスト部分の内容を検査し、音質デ
ータが含まれている場合には、受信した電子メールから
音質データ(VF)を分離し、ボイスフォントデータベ
ース部330に対して出力する。ボイスフォントデータ
ベース部330は、受信部30から入力された音質デー
タを記憶・管理する。
【0060】[電子メールの送信]次に、通信ネットワ
ーク2a内の端末装置3a−1が、通信ネットワーク2
b内の端末装置3b−1に対して電子メール(図3)を
送信する際の動作を説明する。まず、端末装置3a−1
のユーザーは、端末装置3a−1の入力装置40を操作
して、送信先(端末装置3b−1)の電子メールアドレ
スおよび通信文(音質データ以外のテキストデータ等)
を入力し、端末装置3a−1に対して端末装置3b−1
への電子メールの送信を指示する。
【0061】入力装置40は、ユーザーが入力した電子
メールアドレス、通信文および電子メール送信の指示を
受け入れ、送信・制御部42に対して出力する。送信・
制御部42は、端末装置3a−1の電子メールアドレス
を送信元IDとして、端末装置3b−2の電子メールア
ドレスを送信先IDとして、通信文をテキストとして送
信部44に対して出力する。送信部44は、送信・制御
部42から入力された送信元IDおよび送信先IDをヘ
ッダ部分に多重化し、テキストを電子メールのメールテ
キスト部分に多重化して、電子メールを作成し、通信網
20a,20bを介して端末装置3b−1に対して出力
する。
【0062】[電子メールの受信・音声出力]次に、通
信ネットワーク2b内の端末装置3b−1が、通信ネッ
トワーク2a内の端末装置3a−1が送信した電子メー
ル(図3)を受信し、音声出力する際の動作を説明す
る。端末装置3b−1の受信部30は、端末装置3a−
1から伝送されてきた通信文を含む電子メールを受信す
ると、電子メールのテキストデータの内容を検査し、テ
キストデータに音質データが含まれていない場合には、
受信した電子メールから通信文を分離し、テキストとし
て音声合成部32のテキスト解析部320に対して出力
し、さらに、ヘッダから送信元IDを分離してボイスフ
ォント切替部326に対して出力する。
【0063】ボイスフォント切替部326は、受信部3
0から入力された送信元IDをボイスフォント検索部3
28に対して出力し、ボイスフォント検索部328を制
御して、ボイスフォントデータベース部330内の音質
データを検索させる。ボイスフォント検索部328は、
ボイスフォント切替部326の制御に応じて、ボイスフ
ォントデータベース部330内の音質データを検索し、
検索結果に応じてボイスフォントデータベース部330
を制御し、ヘッダデータに含まれるユーザーID(szMa
ilID;表1)が、ボイスフォント切替部326から入力
された送信元IDと一致する音質データが存在する場合
には、ボイスフォントデータベース部330を制御し
て、送信元IDに対応する音質データを供給させ、送信
元IDに対応する音質データが存在しない場合には、デ
フォルトの音質データを韻律制御部322および音声生
成部324に供給させる。
【0064】ボイスフォント切替部326は、ボイスフ
ォント検索部328の検査結果に基づいて、ボイスフォ
ントデータベース部330内に送信元IDに対応する音
質データが存在する場合には送信元IDに対応する音質
データに切り替え、送信元IDに対応する音質データが
存在しない場合にはデフォルトの音質データ)に切り替
えて処理を行なうように韻律制御部322および音声生
成部324を制御する。
【0065】韻律制御部322は、ボイスフォントデー
タベース部330から入力され、ボイスフォント切替部
326により切り替えられた音質データのヘッダデータ
に含まれる音声特徴データを用いて、テキスト解析部3
20から入力される発音データに、音声の韻律的な特徴
を示す韻律データを付加し、音声生成部324に対して
出力する。
【0066】音声生成部324は、ボイスフォントデー
タベース部330から入力され、ボイスフォント切替部
326により切り換えられた音質データに含まれる音声
素片と、テキスト解析部320から韻律制御部322を
介して入力される発音データとを対応付けて、音声出力
部38に対して出力する。音声出力部38は、音声生成
部324から入力された発音データに対応する音声素片
が示す音質および音声特徴データが示す特徴を有する音
声信号を生成し、外部に出力する。
【0067】以下、図4を参照して、端末装置3b−1
が、端末装置3a−1から受信した電子メールのテキス
トを音声出力する際の処理を、さらに説明する。図4
は、図1および図2に示した端末装置3(3b−1)の
音声出力処理を示すフローチャート図である。
【0068】図4に示すように、ステップ100(S1
00)において、端末装置3b−1の受信部30は、通
信網20a,20bを介して端末装置3a−1から電子
メールを受信し、受信した電子メールを開き、電子メー
ルのヘッダから送信元IDを分離してボイスフォント切
替部326に対して出力し、テキストを分離して音声合
成部32のテキスト解析部320に対して出力する。
【0069】ステップ102(S102)において、ボ
イスフォント切替部326は、受信部30から入力され
た送信元IDを取得する。
【0070】ステップ104(S104)において、ボ
イスフォント切替部326は、音質データの切り替えを
ボイスフォント検索部328に対して指示する。
【0071】ステップ106(S106)において、ボ
イスフォント切替部326は、韻律制御部322および
音声生成部324に、音声出力処理用に設定されている
音質データが、処理に使用するために設定されている
(現在使用中の)音質データであるか否かを判断し、現
在使用中の音質データである場合にはS118の処理に
進み、現在使用中の音質データでない場合にはS108
の処理に進む。
【0072】ステップ108(S108)において、ボ
イスフォント切替部326は、ボイスフォント検索部3
28を制御し、送信元のユーザーID(送信元ID)に
対応する音質データが、ボイスフォントデータベース部
330内に存在するか否かを検索させる。
【0073】ステップ110(S110)において、ボ
イスフォント切替部326は、ボイスフォント検索部3
28の検索結果に基づいて、ボイスフォントデータベー
ス部330内に送信元IDに対応する音質データがある
か否かを判断し、送信元IDに対応する音質データがあ
る場合にはS112の処理に進み、送信元IDに対応す
る音質データがない場合にはS114の処理に進む。
【0074】ステップ112(S112)において、ボ
イスフォント切替部326は、ボイスフォント検索部3
28を制御して、ボイスフォントデータベース部330
から送信元IDに対応する音質データを、韻律制御部3
22および音声生成部324に供給させるとともに、そ
れまで使用していた音質データの代わりに、ボイスフォ
ント検索部328の検索の結果として得られた送信元I
Dに対応する音質データを切り替えて用いるように、韻
律制御部322および音声生成部324を制御する。
【0075】ステップ114(S114)において、ボ
イスフォント切替部326は、ボイスフォント検索部3
28を制御して、ボイスフォントデータベース部330
からデフォルトの音質データを、韻律制御部322およ
び音声生成部324に供給させるとともに、それまで使
用していた音質データの代わりに、デフォルトの音質デ
ータを切り替えて用いるように、韻律制御部322およ
び音声生成部324を制御する。
【0076】ステップ116(S116)において、韻
律制御部322および音声生成部324は、ボイスフォ
ント切替部326の制御に従って、それまで処理に使用
していた音質データの音声素片および韻律パラメータの
代わりに、ボイスフォントデータベース部330から新
たに供給された音質データの音声素片および韻律パラメ
ータを処理に使用するように設定を変更する。
【0077】ステップ118(S118)において、テ
キスト解析部320は、受信した電子メールのテキスト
を解析して発音データを生成し、韻律制御部322に対
して出力する。
【0078】ステップ120(S120)において、韻
律制御部322および音声生成部324は、ボイスフォ
ント切替部326の制御に従って、テキスト解析部32
0が生成した発音データに、処理に使用するように設定
されている音質データの音声素片を対応付け、さらに、
音声特徴データを付加して音声出力部38に対して出力
する。音声出力部38は、音声生成部324から入力さ
れた音声素片が示す音質、および、音声特徴データが示
す特徴を有する音声信号を合成し、外部に出力する。
【0079】[音声メールシステム1を用いることによ
る効果]以上説明したように、第1の実施形態として示
した音声メールシステム1によれば、音声素片および音
声特徴データがユーザーIDと既に対応付けられた形で
端末装置3それぞれに音質データとして供給される。従
って、端末装置3それぞれは、音声素片および音声特徴
データとユーザーIDとを対応付けたテーブルを持たず
に送信元IDに応じた音質の音声でメールの音声出力を
行なうことができる。
【0080】しかも、全ての端末装置3に対して、音質
データを記録媒体340あるいは通信網20a,20b
を介して供給することができるので、音声メールシステ
ム1内の全ての端末装置3に同一の音質データを供給す
ることができる。また、全ての端末装置3に対して、更
新後の音質データを記録媒体340等を介して供給する
ことにより、音声メールシステム1内の全ての端末装置
3内の音質データを一括して更新することができる。
【0081】また、音声メールシステム1においては、
音声素片および音声特徴データと、ネットワーク内でユ
ニークなユーザーIDとを対応付けた音質データが作成
されるので、各ユーザーの音質データに対して確実に識
別子を付すことができる
【0082】また、音声メールシステム1においては、
ボイスフォント生成装置36を利用して簡単に音質デー
タを作成し、全ての端末装置3に設定可能であるので、
システム管理者の手間が不要である。逆に、全ての端末
装置3における音質データを一致させる必要は必ずしも
ないので、表1に示した音声特徴データの設定を、設定
先に応じて変更することにより、友人の端末装置3には
カジュアルな口調で電子メールの音声出力を行ない、仕
事関係の端末装置3にはビジネスに適した口調で電子メ
ールの音声出力を行なうようにする等、場合に応じて音
声出力に用いる音声の口調を変更することも可能であ
る。
【0083】[変形例等]なお、上記実施形態において
は、通信ネットワーク2a内の端末装置3a−1および
通信ネットワーク2b内の端末装置3b−1の動作のみ
を示したが、他の端末装置3の動作も同じであり、任意
の端末装置3の間で電子メールの送信、受信および音声
出力が可能である。また、上記実施形態においては、通
信ネットワーク2a,2bそれぞれの3の間で、複数の
ネットワークにまたがった電子メールの伝送を行なう場
合を説明したが、通信ネットワーク2a,2bそれぞれ
に閉じた形でのみ、端末装置3間の電子メールの送信、
受信および音声出力が可能なように構成を変更すること
ができる。なお、上記実施例においては、受信部30が
テキスト解析部320に対して電子メールのテキストの
みを出力する場合を例示したが、電子メール全体をテキ
スト解析部320に対して出力し、送信元IDおよび送
信先IDもテキストとともに音声出力するように構成を
変形することができる。
【0084】また、表1に示した音声特徴データは例示
であって、例えば、音声特徴データに「お国なまり」を
示すデータ等、他のデータを追加したり、必要ないデー
タを省略する等の変更が可能である。また、図2に示し
た端末装置3の構成は例示であって、端末装置3の各部
分は、同一の機能および性能を達成することができる限
り、同等の他の手段に置換することができ、また、ハー
ドウェア的に構成されるか、ソフトウェア的に構成され
るかを問わない。
【0085】[第2実施形態]以下、本発明の第2の実施
形態を説明する。第1の実施形態として示した音声メー
ルシステム1においては、各端末装置3(3a−1〜3
a−m,3b−1〜3b−n)が音質データを記録・管
理し、電子メールを音声出力するように構成されてい
た。しかしながら、音声メールシステム1においては、
音声合成機能等を有さない一般的な電話機を用いて電子
メールの音声出力機能を利用することはできない。第2
の実施形態として示す通信ネットワーク2cは、かかる
観点から、一般的な電話機に対してもテキストの音声出
力機能を提供しうるように音声メールシステム1をさら
に改良したものである。
【0086】[通信ネットワーク2cの構成]以下、本
発明にかかる通信ネットワーク2c(ネットワークC)
の構成を説明する。図5は、本発明の第2の実施形態と
して示す通信ネットワーク2cの構成を示す図である。
図5に示すように、通信ネットワーク2cは、通信網2
0cに接続されたゲートウェイプロセッサ22c−1,
22c−2、端末装置3c−1〜3c−p(図5におい
てはp=4の場合を例示)、電子メールサーバ5および
電話機6を通信ノードとして含む。
【0087】なお、図5において、通信ネットワーク2
cの通信網20cは、図1に示した音声メールシステム
1の通信網20a,20bに対応し、ゲートウェイプロ
セッサ22c−1,22c−2はゲートウェイプロセッ
サ22a−1,22a−1,22b−1,22b−2に
対応し、端末装置3c−1〜3c−p(端末装置3a−
1〜3a−m,3b−1〜3b−nと同様に、以下、端
末装置3と略記する)は、図1および図2に示した端末
装置3a−1〜3a−m,3b−1〜3b−nに対応
し、これらの対応する構成部分は同一構成であって、同
一の機能を有する。ゲートウェイプロセッサ22cは、
これらの構成部分により、ユーザーに対して音声メール
システム1においてと同様な電子メールのテキストの音
声出力機能を提供するとともに、音声合成機能等を有さ
ない一般的な電話機6に対しても、ユーザーそれぞれに
個別の音質データを用いたテキストの音声出力機能を提
供する。
【0088】[通信ネットワーク2cの各構成部分]以
下、通信ネットワーク2cの構成部分の内、音声メール
システム1(図1)の構成部分と異なる電子メールサー
バー5および電話機6を説明する。
【0089】[電話機6]電話機6は、例えば、DTM
F(dual tone multi frequency)送信機能を有するアナ
ログ電話機、あるいは、ISDN端末であって、通信網
20cを介して端末装置3あるいは他の電話機(図示せ
ず)の間で音声信号を送信および受信するとともに、D
TMFあるいはディジタルデータの形式で、ユーザーI
D、パスワードおよびその他の操作データを電子メール
サーバー5に対して送信する。
【0090】[電子メールサーバー5]以下、図6を参
照して、電子メールサーバー5の構成を説明する。図6
は、図5に示した電子メールサーバー5の構成を示す図
である。図6に示すように、電子メールサーバー5は、
音声合成部32、入力装置40、受信部50、電子メー
ルデータベース(EMDB)52、再生制御部54およ
び送信部56から構成される。なお、図6においては、
電子メールサーバー5の構成部分の内、図1および図2
に示した端末装置3の構成部分と同じものには同一の符
号を付して示してある。電子メールサーバー5は、これ
らの構成部分により、端末装置3から通信網20cを介
して受信した電子メールのテキストおよび音質データを
記憶・管理し、電話機6から操作に応じて、電子メール
の送信元IDに対応する音質の音声でテキストを読み上
げる音声信号を生成し、電話機6に送信する。
【0091】[電子メールサーバー5の構成部分]以
下、電子メールサーバー5の各構成部分を説明する。
【0092】[受信部50]電子メールサーバー5にお
いて、受信部50は、端末装置3の受信部30に対応
し、受信部30と同様に、通信網20cの種類に応じて
TA、モデムあるいはLAN接続ボードの受信部を含
み、通信網20cから受信データとして入力される電子
メール(図3)を受信して開き、開いた電子メール(テ
キストおよびヘッダ)を電子メールデータベース52に
対して出力して、音声合成部32のボイスフォント切替
部326に対して出力する。また、受信部50は、受信
部30と同様に、受信した電子メールが音質データを含
む場合には、電子メールから音質データ(VF)を分離
し、ボイスフォントデータベース部330に対して出力
する。また、受信部50は、必要に応じてDTMFレシ
ーバをさらに含み、電話機6から通信網20cを介し
て、ディジタルデータあるいはDTMFの形式で入力さ
れるユーザーID、パスワード(PW)、および、電子
メールサーバー5に対してテキストの音声出力を指示す
る操作データ等を受信して、再生制御部54に対して出
力する。
【0093】[電子メールデータベース52]電子メー
ルデータベース52は、受信部50から入力された電子
メールのテキストおよびヘッダを記憶・管理し、再生制
御部54の制御に応じて、記憶した電子メールのテキス
トをテキスト解析部320に対して出力し、電子メール
のヘッダに含まれる送信元IDをボイスフォント切替部
326に対して出力する。
【0094】[再生制御部54]再生制御部54は、受
信部50からテキストの音声出力を指示する操作データ
が入力されると、一緒に入力されるユーザーIDとパス
ワードとの対応を検査し、ユーザーIDとパスワードと
の対応が正しい場合にのみ、電子メールデータベース5
2を制御して、入力されたユーザーIDを送信先アドレ
スとしてヘッダに含む電子メールを検索させ、検索の結
果として発見された電子メールをテキスト解析部320
およびボイスフォント切替部326に対して出力させ
る。また、再生制御部54は、送信部56を制御し、音
声合成部32および送信部56が生成した音声信号を、
通信網20cを介して電話機6あるいは他の端末装置3
に対して送信させる。
【0095】[送信部56]送信部56は、端末装置3
における音声出力部38および送信部44に対応し、音
声通信可能なTAの送信部あるいはアナログ電話回線イ
ンターフェースの送信部を含み、再生制御部54の制御
に従って、音声出力部38と同様に、音声生成部324
から入力される音声素片および音声特徴データから、電
子メールのテキストの内容を送信元IDそれぞれに対応
する音質で読み上げる音声信号を生成し、送信部44と
同様に通信網20cを介して電話機6に対して送信す
る。
【0096】[電子メールサーバー5の動作]以下、端
末装置3c−1が送信した電子メールを電子メールサー
バー5が記憶・管理し、電話機6に対するユーザーの操
作に応じて音声出力する場合を例に、通信ネットワーク
2cの動作を説明する。
【0097】[電子メールの受信]通信ネットワーク2
cにおいて、端末装置3c−1が通信網20cを介して
電子メールサーバー5に対して電子メールを送信する
と、電子メールサーバー5の受信部50は、通信網20
cを介して入力される電子メールを受信して、電子メー
ルデータベース52に対して出力する。電子メールデー
タベース52は、入力された電子メールを記憶・管理す
る。
【0098】[テキストの音声出力]電話機6のユーザ
ーは、電話機6から電子メールサーバー5に対して発呼
し、電話機6と電子メールサーバー5との間に通話路を
設定する。さらに、ユーザーは電話機6のテンキーを操
作し、電子メールサーバー5に対して電子メールの読み
上げを要求する符号(操作データ)を入力し、さらに、
続いて、電子メールサーバー5が受信した電子メールに
含まれるユーザーID(送信先ID)、および、この送
信先IDに対応付けられて予め電子メールサーバー5の
再生制御部54に設定されているパスワードを入力す
る。電話機6は、ユーザーの操作に応じて、操作デー
タ、ユーザーIDおよびパスワードを、DTMFあるい
はディジタルデータの形式で通信網20を介して電子メ
ールサーバー5に対して送信する。
【0099】電子メールサーバー5の受信部50は、電
話機6から入力される操作データ、ユーザーIDおよび
パスワードに基づいて電子メールデータベース52に記
憶されている端末装置3c−1からの電子メールを検索
し、電子メールデータベース52を制御して、検索の結
果として見つけた電子メールのテキストを、音声合成部
32のテキスト解析部320に対して出力させ、ヘッダ
に含まれる送信元IDをボイスフォント切替部326に
対して出力させる。音声合成部32および送信部56
は、電子メールデータベース52から入力されたテキス
トの内容を、ヘッダ内の送信元IDに対応する音質デー
タの音質で読み上げる音声信号を生成し、通信網20c
を介して電話機6に対して送信する。電話機6は、通信
網20cを介して端末装置3c−1から受信した音声信
号を、ユーザーに対して出力する。
【0100】以上説明したように、通信ネットワーク2
cによれば、ユーザーに対して音声メールシステム1
(図1)においてと同様な電子メールのテキストの音声
出力機能を提供するとともに、音声合成機能等を有さな
い一般的な電話機6に対しても、ユーザーそれぞれに個
別の音質データを用いたテキストの音声出力機能を提供
することができる。
【0101】なお、通信ネットワーク2cにおける端末
装置3による電子メールサーバー5に対する通信網20
cを介した音質データの設定は、音声メールシステム1
における端末装置3の間の音質データの設定と同様であ
る。また、以上の第2の実施形態の動作説明において
は、端末装置3c−1と、電子メールサーバー5と、電
話機6との間で通信を行なう場合について説明を行なっ
たが、端末装置3c−1〜3c−pのいずれかと、電子
メールサーバー5と、電話機6との間でも同様な通信が
可能である。
【0102】また、第2の実施形態に示した電子メール
サーバー5は、複数の通信ネットワークの間で共用され
うる。また、通信ネットワーク2cにおける電話機6の
台数は1台に限らず、複数の電話機6を通信ネットワー
ク2cに接続することができ、また、端末装置3に操作
データ、ユーザーIDおよびパスワードの送信機能およ
び音声通信機能を付加することにより、電子メールサー
バー5の電話機6に対する機能を端末装置3に対しても
提供することができる。また、ここで述べた他、通信ネ
ットワーク2cに対しては、例えば、電子メールデータ
ベース52および受信部50が電子メール全体を出力
し、送信元IDおよび送信先IDもテキストとともに音
声出力するように構成を変形する等、音声メールシステ
ム1に対してと同様な変形が可能であり、さらに、音声
メールシステム1への電子メールサーバー5の付加、あ
るいは、音声メールシステム1と通信ネットワーク2c
との接続等、音声メールシステム1と通信ネットワーク
システム2cとを組み合わせることが可能である。
【0103】[第3実施形態]以下、本発明の第3の実
施形態を説明する。第1の実施形態および第2の実施形
態に示した音声メールシステムによれば、メールの送信
者それぞれに固有の音質でメールを音声出力することが
できる。しかしながら、上記音声メールシステムにおい
て、音質データを他人の端末装置に設定すると、その管
理および利用の制限は難しく、第三者の勝手な使用(例
えば悪戯等の不正使用)により音質データの作成者が不
利益を被る可能性がある。
【0104】また、例えば、本人の誤操作により、ある
いは、第三者の勝手な利用により、カジュアルな調子の
音質データが設定された顧客の端末装置に対して電子メ
ールを送ると、顧客に対して不適切な調子で電子メール
が音声出力されてしまう。このような場合であっても、
他人の端末装置を操作して音質データの変更・削除を行
なうことは不適切であり、他の何らかの適切な方法で音
質データの使用可能範囲を制限する必要がある。本発明
の第3の実施形態は、上述した不具合を防ぐ観点から、
音質データの有効期限および音質データの使用範囲を制
限できるように音質データおよびボイスフォント切替部
326の動作を拡張したものである。
【0105】[音質データの拡張]第3の実施形態にお
いては、第1の実施形態において表1に示した音質デー
タのヘッダデータ(図1)に、端末装置3が一般的なコ
ンピュータの機能として有する時計機能を利用した使用
期限を定めた音質データの使用、および、電子メールの
送信先ID(図3)による音質データの使用制限を可能
とする下表2に示す各データがさらに付加される。
【0106】
【表2】 (表2;音質データのヘッダデータに付加されたデー
タ) TCHAR szReceiverMailID[TSSI_MAILIDLEN]; WORD wLimitFlag; TCHAR szExpireDate[TSSI_DATELEN] 但し、 "szReceiverMailID(制限対象/非制限対象ID)"は、
複数の送信先ID(図3)を設定することができ、ここ
に設定された送信先IDを含む電子メールが、送信元I
Dによる音質データの使用制限の対象とされる。"wLimi
tFlag(制限方法フラグ)"には、"VFLIMIT_OR","VFLIMI
T_XOR"の2種類があり、"VFLIMIT_OR"は、"szReceiverM
ailID(制限対象/非制限対象ID)"として設定された
送信先IDに対してのみ音質データを使用不可とし、"V
FLIMIT_XOR"は、"szReceiverMailID(制限対象/非制限
対象ID)"として設定された送信先ID以外に対して
のみ音質データを使用不可とする。"szExpireDate(期
限データ)"は、例えば、19971231(1997年12月31日)
というように設定され、音質データの有効期限を示
す。"szExpireDate(期限データ)"の設定がない場合に
は、音質データの有効期間が無制限であることを示す。
【0107】[音質データの使用制限を行なう場合の音
声メールシステム1の動作]以下、図7を参照して、音
声メールシステム1(図1)において、端末装置3b−
1が、端末装置3a−1から電子メールを受信し、使用
制限付で音質データを用いて電子メールのテキストを音
声出力する場合の動作を説明する。図7は、端末装置3
(3b−1;図1,図3)が、音質データを使用制限付
きで用いた音声出力処理を行なう場合を示すフローチャ
ート図である。
【0108】図7に示すように、ステップ200(S2
00)において、端末装置3b−1の受信部30は、通
信網20a,20bを介して端末装置3a−1から電子
メールを受信し、受信した電子メールを開き、電子メー
ルのヘッダから送信元ID、送信先IDおよび電子メー
ルの送信時刻(送信の年月日・時分)を分離してボイス
フォント切替部326に対して出力し、テキストを分離
して音声合成部32のテキスト解析部320に対して出
力する。
【0109】ステップ202(S202)において、ボ
イスフォント切替部326は、受信部30から入力され
た送信元ID、送信先IDおよび送信時刻を取得する。
【0110】ステップ204(S204)において、ボ
イスフォント切替部326は、音質データの切り替えを
ボイスフォント検索部328に対して指示する。
【0111】ステップ206(S206)において、ボ
イスフォント切替部326は、韻律制御部322および
音声生成部324に、音声出力処理用に設定され、使用
可能な状態になっている音質データが、現在使用中の音
質データであるか否かを判断し、現在使用中の音質デー
タである場合にはS214の処理に進み、現在使用中の
音質データでない場合にはS208の処理に進む。
【0112】ステップ208(S208)において、ボ
イスフォント切替部326は、ボイスフォント検索部3
28を制御し、受信部30から入力された送信元IDに
対応する音質データが、ボイスフォントデータベース部
330内に存在するか否かを検索させる。
【0113】ステップ210(S210)において、ボ
イスフォント切替部326は、ボイスフォント検索部3
28の検索結果に基づいて、ボイスフォントデータベー
ス部330内に送信元IDに対応する音質データがある
か否かを判断し、送信元IDに対応する音質データがあ
る場合にはS212の処理に進み、送信元IDに対応す
る音質データがない場合にはS224の処理に進む。
【0114】ステップ212(S212)において、ボ
イスフォント切替部326は、ボイスフォント検索部3
28を制御して、ボイスフォントデータベース部330
から送信元IDに対応する音質データを、韻律制御部3
22および音声生成部324に供給させて使用可能にす
るとともに、それまで使用していた音質データの代わり
に、ボイスフォント検索部328の検索の結果として得
られた送信元IDに対応する音質データを切り替えて用
いるように、韻律制御部322および音声生成部324
を制御する。
【0115】ステップ214(S214)において、ボ
イスフォント切替部326は、使用可能な状態になって
いる音質データのヘッダデータの制限対象/非制限対象
データ(表2)の部分を参照し、送信先IDが設定され
ているか否かを判断し、制限対象/非制限対象データに
送信先IDが設定されている場合にはS216の処理に
進み、設定されていない場合にはS222の処理に進
む。
【0116】ステップ216(S216)において、ボ
イスフォント切替部326は、え3b−1の電子メール
アドレスが、制限対象/非制限対象データに設定された
送信先IDのいずれかと一致するか否かを判断し、一致
する場合にはS218の処理に進み、一致しない場合に
はS220の処理に進む。
【0117】ステップ218(S218)において、ボ
イスフォント切替部326は、音質データのヘッダデー
タの制限方法フラグを判断し、制限方法フラグがVFLIMI
T_XORである場合にはS222の処理に進み、VFLIMIT_X
ORでない場合(VFLIMIT_OR出ある場合にはS224の処
理に進む。
【0118】ステップ220(S220)において、ボ
イスフォント切替部326は、音質データのヘッダデー
タの制限方法フラグを判断し、制限方法フラグがVFLIMI
T_XORである場合にはS224の処理に進み、VFLIMIT_X
ORでない場合(VFLIMIT_OR出ある場合にはS222の処
理に進む。
【0119】ステップ222(S222)において、ボ
イスフォント切替部326は、音質データの期限データ
と、端末装置3b−1のシステムが提供する時計機能が
示す現在の年月日とを比較し、現在の年月日が期限デー
タが示す有効期限の範囲内であればS228の処理に進
み、範囲外であればS224の処理に進む。
【0120】ステップ224(S224)において、ボ
イスフォント切替部326は、使用可能な状態にある
(使用中の)音質データがデフォルトの音質データであ
るか否かを判断し、使用中の音質データがデフォルトの
音質データである場合にはS228の処理に進み、デフ
ォルトの音質データでない場合にはS226の処理に進
む。
【0121】ステップ226(S226)において、ボ
イスフォント切替部326は、ボイスフォント検索部3
28を制御して、ボイスフォントデータベース部330
からデフォルトの音質データを、韻律制御部322およ
び音声生成部324に供給させるとともに、それまで使
用していた音質データの代わりに、デフォルトの音質デ
ータを切り替えて用いるように、韻律制御部322およ
び音声生成部324を制御する。
【0122】ステップ228(S228)およびステッ
プ230(S230)において、韻律制御部322およ
び音声生成部324は、ボイスフォント切替部326の
制御に従って、全てのテキストの内容の出力が終了する
まで、テキスト解析部320が生成した発音データに、
処理に使用するように設定されている音質データの音声
素片を対応付け、さらに、音声特徴データを付加して音
声出力部38に対して出力する。音声出力部38は、音
声生成部324から入力された音声素片が示す音質、お
よび、音声特徴データが示す特徴を有する音声信号を合
成し、外部に出力する。
【0123】なお、第3の実施形態は、音声メールシス
テム1(図1;第1の実施形態)において、使用制限付
きで音質データを用いてテキストを音声出力する場合を
説明したが、第3の実施形態に示した使用制限付きで音
質データを用いてテキストを音声出力する方法は、通信
ネットワーク2c(図5;第2実施形態)に対しても応
用可能であることはいうまでもない。
【0124】また、以上、音質データの使用期限を日単
位で設定する場合を示したが、第3の実施形態に示した
音声出力方法は、使用期限を時・分等の他の単位ごとに
設定し、設定した単位で使用期限を管理するように変形
することができる。また、以上、音質データの使用期限
の終了時のみを音質データに設定する場合を示したが、
第3の実施形態に示した音声出力方法は、使用期限の開
始時と終了時とを設定し、設定した範囲内のみで音質デ
ータを使用可能とするように変形することができる。ま
た、第3の実施形態に示した音声出力方法に対しても、
第1の実施形態および第2の実施形態に示した変形例と
同様な変形が可能である。
【0125】
【発明の効果】上述したように、本発明にかかる音声メ
ールシステム、音声合成装置およびこれらの方法によれ
ば、電子メールの音声出力の際の音質の設定が容易で、
しかも、電子メーを送信したユーザーそれぞれに固有の
音質でテキストを音声出力することができる。
【0126】また、本発明にかかる音声メールシステ
ム、音声合成装置およびこれらの方法によれば、電子メ
ールそれぞれに音声出力の際の音質を示すデータ(音質
データ)を付加しなくとも、電子メールを送信したユー
ザーそれぞれに固有の音質でテキストを音声出力するこ
とができる。また、本発明にかかる音声メールシステ
ム、音声合成装置およびこれらの方法によれば、任意の
数の送信元IDで共有することができ、例えば、同一の
ユーザーが複数のIDを有する場合であっても、同一の
音質データを複数、登録することに起因する端末装置の
資源の無駄使いを防ぐことができ、多くの音質データを
各端末装置に登録することができる。
【0127】また、本発明にかかる音声メールシステ
ム、音声合成装置およびこれらの方法によれば、本発明
は、音質データをネットワーク内に広めてしまっても、
その利用を一定期間内に制限することができ、第3者の
勝手な使用による作成者の不利益の発生を防ぐことがで
きる。
【0128】また、本発明にかかる音声メールシステ
ム、音声合成装置およびこれらの方法によれば、音質デ
ータの不適切な使用を防ぐために、音質データの使用可
能範囲を制限することができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態として示す音声メール
システムの構成図である。
【図2】図1に示した端末装置の構成を示す図である。
【図3】図1および図2に示した端末装置の間で伝送さ
れる電子メールの構成を示す図である。
【図4】図1および図2に示した端末装置の音声出力処
理を示すフローチャート図である。
【図5】本発明の第2の実施形態として示す通信ネット
ワークの構成を示す図である。
【図6】図5に示した音声メールサーバの構成を示す図
である。
【図7】端末装置が、音質データを使用制限付きで用い
た音声出力処理を行なう場合を示すフローチャート図で
ある。
【符号の説明】
1・・・音声メールシステム 2a〜2c・・・通信ネットワーク 20a〜20c・・・通信網 22a−1〜22c−2・・・ゲートウェイプロセッサ 3a−1〜3c−p,3・・・端末装置 30・・・受信部 32・・・音声合成部 320・・・テキスト解析部 322・・・韻律制御部 324・・・音声生成部 326・・・ボイスフォント切替部 328・・・ボイスフォント検索部 330・・・ボイスフォントデータベース部 34・・・ボイスフォント入力部 36・・・ボイスフォント生成装置 38・・・音声出力部 40・・・入力装置 42・・・送信・制御部 44・・・送信部 5・・・電子メールサーバー 50・・・受信部 52・・・電子メールデータベース 54・・・再生制御部 56・・・送信部 6・・・電話機
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI G10L 19/00 G10L 3/00 Q H04L 12/54 N 12/58 H04L 11/20 101B H04M 3/42 (72)発明者 斎 藤 隆 神奈川県大和市下鶴間1623番地14 日本 アイ・ビー・エム株式会社 大和事業所 内 (56)参考文献 特開 平5−260082(JP,A) 特開 平8−272587(JP,A) 特開 平9−50286(JP,A) 特開 平4−177299(JP,A) 特開 平4−175049(JP,A) 特開 平5−233565(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 13/06 G10L 13/00

Claims (11)

    (57)【特許請求の範囲】
  1. 【請求項1】ネットワークを介して接続された複数の端
    末装置を通信ノードとして含む音声メールシステムであ
    って、 前記端末装置それぞれは、 複数の音声それぞれの音質を示す前記音質データそれぞ
    れを、それぞれネットワーク内でユニークな識別子と対
    応付けて管理する音質データ管理手段と、 少なくとも通信文および前記識別子を含むメールを受信
    するメール受信手段と、 受信した前記メールが含む前記識別子と対応付けて管理
    した前記音質データが示す音質で、受信した前記メール
    が含む通信文の内容を示す音声を合成する音声合成手段
    と、 合成した前記音声を出力する音声出力手段とを有し、前記音質データ管理手段における1の前記音質データに
    対応付ける前記識別子の数を複数とすることが可能であ
    音声メールシステム。
  2. 【請求項2】ネットワークを介して接続された1つ以上
    の端末装置と1つ以上の音声メールサーバー装置とを通
    信ノードとして含む音声メールシステムであって、 前記音声メールサーバー装置は、 複数の音声それぞれの音質を示す前記音質データそれぞ
    れを、それぞれネットワーク内でユニークな識別子と対
    応付けて管理する音質データ管理手段と、 少なくとも通信文および前記識別子を含むメールを受信
    するメール受信手段と、 受信した前記メールが含む前記識別子と対応付けて管理
    した前記音質データが示す音質で、受信した前記メール
    が含む通信文の内容を示す音声を合成する音声合成手段
    と、 前記複数の端末装置のいずれかからの要求に応じて、合
    成した前記音声を前記複数の端末装置のいずれかに対し
    て出力する音声出力手段とを有し、前記音質データ管理手段における1の前記音質データに
    対応付ける前記識別子の数を複数とすることが可能であ
    音声メールシステム。
  3. 【請求項3】前記端末装置それぞれは、 前記メールを、前記ネットワークを介して他の通信ノー
    ドに対して送信するメール送信手段を有する請求項1ま
    たは2に記載の音声メールシステム。
  4. 【請求項4】前記メールは、少なくとも通信文および送
    信元の前記識別子を含み、 前記音声合成手段は、受信した前記メールが含む送信元
    の前記識別子と対応付けた前記音質データが示す音質
    で、受信した前記メールが含む通信文の内容を示す音声
    を合成する請求項1〜3のいずれかに記載の音声メール
    システム。
  5. 【請求項5】入力される音声それぞれの音質を示す音質
    データを抽出し、それぞれ前記ネットワーク内でユニー
    クな識別子と対応付けて、前記ネットワークを介して前
    記通信ノードそれぞれに送信する音質データ抽出手段を
    さらに有し、 前記音質データ管理手段は、前記ネットワークを介して
    前記抽出した音質データそれぞれを受信し、受信した前
    記音質データを、それぞれネットワーク内でユニークな
    識別子と対応付けて管理し、前記音質データ抽出手段および前記音質データ管理手段
    における1の前記音質データに対応付ける前記識別子の
    数を複数とすることが可能である 請求項1〜4のいずれ
    かに記載の音声メールシステム。
  6. 【請求項6】前記通信ノードそれぞれは、動作時刻を計
    る時計手段を有し、 前記音質データそれぞれは、当該音質データの使用期限
    を示す期限データを含み、 前記音声合成手段は、前記通信ノードの動作時刻が、前
    記音質データに含まれる前記期限データが示す使用期限
    内である場合にのみ、前記音質データを用いて音声を合
    成する請求項1〜5のいずれかに記載の音声メールシス
    テム。
  7. 【請求項7】前記メールは送信先の識別子を含み、 前記音質データそれぞれは、当該音質データの使用を許
    可する送信先の識別子を示す使用許可データを含み、 前記音声合成手段は、前記メールに含まれる送信先の識
    別子が、前記使用許可データが使用を許可する送信先の
    識別子である場合に、前記音質データを用いて音声を合
    成する請求項1〜6に記載の音声メールシステム。
  8. 【請求項8】少なくとも通信文および前記識別子を含む
    メールの通信文の音声を合成する音声合成装置であっ
    て、 複数の音声それぞれの音質を示す音質データそれぞれ
    を、それぞれ前記メールを伝送するネットワーク内で
    ニークな識別子と対応付けて管理する音質データ管理手
    段と、 前記識別子と対応付けて管理した前記音質データが示す
    音質で、受信した前記メールが含む通信文の内容を示す
    音声を合成する音声合成手段と前記音質データ管理手段
    における1の前記音質データに対応付ける前記識別子の
    数を複数とすることが可能であるを有する音声合成装
    置。
  9. 【請求項9】複数の音声それぞれの音質を示す前記音質
    データそれぞれを、それぞれネットワーク内でユニーク
    な識別子と対応付けて管理し、 少なくとも通信文および前記識別子を含むメールを受信
    し、 受信した前記メールが含む前記識別子と対応付けた前記
    音質データが示す音質で、受信した前記メールが含む通
    信文の内容を示す音声を合成し、 合成した前記音声を出力する前記音質データの管理にお
    ける1の前記音質データに対応付ける前記識別子の数を
    複数とすることが可能である音声メール通信方法。
  10. 【請求項10】少なくとも通信文および前記識別子を含
    むメールの通信文の音声を合成する音声合成方法であっ
    て、 複数の音声それぞれの音質を示す音質データそれぞれ
    を、それぞれ前記メールを伝送するネットワーク内で
    ニークな識別子と対応付けて管理し、 前記識別子と対応付けて管理した前記音質データが示す
    音質で、受信した前記メールが含む通信文の内容を示す
    音声を合成する前記音質データの管理における1の前記
    音質データに対応付ける前記識別子の数を複数とするこ
    とが可能であるを有する音声合成方法。
  11. 【請求項11】複数の音声それぞれの音質を示す前記音
    質データそれぞれを、それぞれネットワーク内でユニー
    クな識別子と対応付けて管理するステップと、 少なくとも通信文および前記識別子を含むメールを受信
    するステップと、 受信した前記メールが含む前記識別子と対応付けた前記
    音質データが示す音質で、受信した前記メールが含む通
    信文の内容を示す音声を合成するステップと、 をコンピュータに実行させるプログラムを記録し、前記プログラムの前記音質データを管理するステップに
    おける1の音質データに対応付ける識別子の数を複数と
    することが可能である コンピュータ読み取り可能な記録
    媒体。
JP18469197A 1997-07-10 1997-07-10 音声メールシステム、音声合成装置およびこれらの方法 Expired - Fee Related JP3224760B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP18469197A JP3224760B2 (ja) 1997-07-10 1997-07-10 音声メールシステム、音声合成装置およびこれらの方法
US09/097,867 US6289085B1 (en) 1997-07-10 1998-06-16 Voice mail system, voice synthesizing device and method therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP18469197A JP3224760B2 (ja) 1997-07-10 1997-07-10 音声メールシステム、音声合成装置およびこれらの方法

Publications (2)

Publication Number Publication Date
JPH1138996A JPH1138996A (ja) 1999-02-12
JP3224760B2 true JP3224760B2 (ja) 2001-11-05

Family

ID=16157692

Family Applications (1)

Application Number Title Priority Date Filing Date
JP18469197A Expired - Fee Related JP3224760B2 (ja) 1997-07-10 1997-07-10 音声メールシステム、音声合成装置およびこれらの方法

Country Status (2)

Country Link
US (1) US6289085B1 (ja)
JP (1) JP3224760B2 (ja)

Families Citing this family (178)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3287281B2 (ja) 1997-07-31 2002-06-04 トヨタ自動車株式会社 メッセージ処理装置
JP2000176168A (ja) * 1998-12-18 2000-06-27 Konami Co Ltd メッセージ作成ゲーム装置及びメッセージ作成方法
JP2001209400A (ja) * 2000-01-24 2001-08-03 Denso Corp 音声合成装置及び音声案内システム
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
JP2001282281A (ja) * 2000-03-28 2001-10-12 Toshiba Corp 記憶媒体、配信方法及び音声出力装置
DE10018143C5 (de) * 2000-04-12 2012-09-06 Oerlikon Trading Ag, Trübbach DLC-Schichtsystem sowie Verfahren und Vorrichtung zur Herstellung eines derartigen Schichtsystems
US6801931B1 (en) * 2000-07-20 2004-10-05 Ericsson Inc. System and method for personalizing electronic mail messages by rendering the messages in the voice of a predetermined speaker
JP2002055686A (ja) * 2000-08-09 2002-02-20 Casio Comput Co Ltd 音声データの販売方法および販売システム
JP2002149560A (ja) * 2000-08-28 2002-05-24 Sharp Corp 電子メール装置及び電子メールシステム
US6970935B1 (en) * 2000-11-01 2005-11-29 International Business Machines Corporation Conversational networking via transport, coding and control conversational protocols
US7091976B1 (en) 2000-11-03 2006-08-15 At&T Corp. System and method of customizing animated entities for use in a multi-media communication application
US7203648B1 (en) 2000-11-03 2007-04-10 At&T Corp. Method for sending multi-media messages with customized audio
US6976082B1 (en) 2000-11-03 2005-12-13 At&T Corp. System and method for receiving multi-media messages
US6963839B1 (en) 2000-11-03 2005-11-08 At&T Corp. System and method of controlling sound in a multi-media communication application
US20080040227A1 (en) 2000-11-03 2008-02-14 At&T Corp. System and method of marketing using a multi-media communication system
US7035803B1 (en) 2000-11-03 2006-04-25 At&T Corp. Method for sending multi-media messages using customizable background images
US6990452B1 (en) 2000-11-03 2006-01-24 At&T Corp. Method for sending multi-media messages using emoticons
RU2265375C2 (ru) * 2000-11-17 2005-12-10 Тейт Энд Лайл Паблик Лимитед Компани Плавкий, содержащий сукралозу подсластитель
US20020156630A1 (en) * 2001-03-02 2002-10-24 Kazunori Hayashi Reading system and information terminal
GB0113570D0 (en) 2001-06-04 2001-07-25 Hewlett Packard Co Audio-form presentation of text messages
GB0113571D0 (en) * 2001-06-04 2001-07-25 Hewlett Packard Co Audio-form presentation of text messages
US7483834B2 (en) * 2001-07-18 2009-01-27 Panasonic Corporation Method and apparatus for audio navigation of an information appliance
JP4056470B2 (ja) * 2001-08-22 2008-03-05 インターナショナル・ビジネス・マシーンズ・コーポレーション イントネーション生成方法、その方法を用いた音声合成装置及びボイスサーバ
US7671861B1 (en) 2001-11-02 2010-03-02 At&T Intellectual Property Ii, L.P. Apparatus and method of customizing animated entities for use in a multi-media communication application
JP3589216B2 (ja) * 2001-11-02 2004-11-17 日本電気株式会社 音声合成システム及び音声合成方法
US6950799B2 (en) * 2002-02-19 2005-09-27 Qualcomm Inc. Speech converter utilizing preprogrammed voice profiles
US7376220B2 (en) * 2002-05-09 2008-05-20 International Business Machines Corporation Automatically updating a voice mail greeting
AU2003255788A1 (en) * 2002-08-14 2004-03-03 Sleepydog Limited Methods and device for transmitting emotion within a wireless environment
DE60202688T2 (de) * 2002-11-14 2005-06-16 Alcatel Verfahren zum Aufbau einer Verbindung
DE10254183A1 (de) * 2002-11-20 2004-06-17 Siemens Ag Verfahren zur Wiedergabe von gesendeten Textnachrichten
EP2326071A3 (en) * 2003-04-22 2011-11-23 Spinvox Limited A method of providing voicemails to a wireless information device
US8005677B2 (en) * 2003-05-09 2011-08-23 Cisco Technology, Inc. Source-dependent text-to-speech system
JP2005128782A (ja) * 2003-10-23 2005-05-19 Canon Inc 情報処理装置および情報処理方法ならびにプログラム、記憶媒体
US7177404B2 (en) * 2004-02-03 2007-02-13 T-Tag Corporation System for computer-based, calendar-controlled message creation and delivery
JP2007536810A (ja) 2004-05-03 2007-12-13 ソマティック テクノロジーズ インコーポレイテッド 個別化された音響警報を提供するシステム及び方法
US7693719B2 (en) * 2004-10-29 2010-04-06 Microsoft Corporation Providing personalized voice font for text-to-speech applications
US7627638B1 (en) * 2004-12-20 2009-12-01 Google Inc. Verbal labels for electronic messages
US7706510B2 (en) * 2005-03-16 2010-04-27 Research In Motion System and method for personalized text-to-voice synthesis
CN101194224A (zh) * 2005-04-12 2008-06-04 夏普株式会社 音频再现方法、字符码使用设备、分发服务系统和字符码管理方法
JP4787634B2 (ja) * 2005-04-18 2011-10-05 株式会社リコー 音楽フォント出力装置、フォントデータベース及び言語入力フロントエンドプロセッサ
US8015009B2 (en) * 2005-05-04 2011-09-06 Joel Jay Harband Speech derived from text in computer presentation applications
US20070064883A1 (en) * 2005-07-21 2007-03-22 Lawrence Rosenthal Techniques for suspended delivery of messages
WO2007019307A2 (en) 2005-08-03 2007-02-15 Somatic Technologies, Inc. Somatic, auditory and cochlear communication system and method
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US8374863B2 (en) * 2006-02-10 2013-02-12 Spinvox Limited Mass-scale, user-independent, device-independent voice messaging system
US8976944B2 (en) * 2006-02-10 2015-03-10 Nuance Communications, Inc. Mass-scale, user-independent, device-independent voice messaging system
WO2007091096A1 (en) * 2006-02-10 2007-08-16 Spinvox Limited A mass-scale, user-independent, device-independent, voice message to text conversion system
US7831420B2 (en) * 2006-04-04 2010-11-09 Qualcomm Incorporated Voice modifier for speech processing systems
US7991126B1 (en) * 2006-07-19 2011-08-02 Sprint Spectrum L.P. Method for restricting mailbox-to-mailbox message transfers
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US20080165944A1 (en) * 2006-09-12 2008-07-10 T-Tag Corporation Conference calling services
US20080086565A1 (en) * 2006-10-10 2008-04-10 International Business Machines Corporation Voice messaging feature provided for immediate electronic communications
EP2119205A2 (en) 2007-01-09 2009-11-18 Spinvox Limited Detection of unanswered call in order to give calling party the option to alternatively dictate a text message for delivery to the called party
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
WO2008132533A1 (en) * 2007-04-26 2008-11-06 Nokia Corporation Text-to-speech conversion method, apparatus and system
US8131549B2 (en) * 2007-05-24 2012-03-06 Microsoft Corporation Personality-based device
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
WO2010067118A1 (en) 2008-12-11 2010-06-17 Novauris Technologies Limited Speech recognition involving a mobile device
US8655660B2 (en) * 2008-12-11 2014-02-18 International Business Machines Corporation Method for dynamic learning of individual voice patterns
US20100153116A1 (en) * 2008-12-12 2010-06-17 Zsolt Szalai Method for storing and retrieving voice fonts
US20100324895A1 (en) * 2009-01-15 2010-12-23 K-Nfb Reading Technology, Inc. Synchronization for document narration
EP2224426B1 (en) 2009-02-25 2013-04-24 Research In Motion Limited Electronic Device and Method of Associating a Voice Font with a Contact for Text-To-Speech Conversion at the Electronic Device
US8645140B2 (en) * 2009-02-25 2014-02-04 Blackberry Limited Electronic device and method of associating a voice font with a contact for text-to-speech conversion at the electronic device
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US20120309363A1 (en) 2011-06-03 2012-12-06 Apple Inc. Triggering notifications associated with tasks items that represent tasks to perform
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
WO2011089450A2 (en) 2010-01-25 2011-07-28 Andrew Peter Nelson Jerram Apparatuses, methods and systems for a digital conversation management platform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US9009040B2 (en) * 2010-05-05 2015-04-14 Cisco Technology, Inc. Training a transcription system
US20120069974A1 (en) * 2010-09-21 2012-03-22 Telefonaktiebolaget L M Ericsson (Publ) Text-to-multi-voice messaging systems and methods
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US20120265533A1 (en) * 2011-04-18 2012-10-18 Apple Inc. Voice assignment for text-to-speech output
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
JP2014011509A (ja) * 2012-06-27 2014-01-20 Sharp Corp 音声出力制御装置、音声出力制御方法、プログラム及び記録媒体
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9570066B2 (en) * 2012-07-16 2017-02-14 General Motors Llc Sender-responsive text-to-speech processing
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
EP3809407A1 (en) 2013-02-07 2021-04-21 Apple Inc. Voice trigger for a digital assistant
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
AU2014233517B2 (en) 2013-03-15 2017-05-25 Apple Inc. Training an at least partial voice command system
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
CN104050962B (zh) * 2013-03-16 2019-02-12 广东恒电信息科技股份有限公司 基于语音合成技术的多功能阅读器
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
KR101922663B1 (ko) 2013-06-09 2018-11-28 애플 인크. 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스
JP2016521948A (ja) 2013-06-13 2016-07-25 アップル インコーポレイテッド 音声コマンドによって開始される緊急電話のためのシステム及び方法
AU2014306221B2 (en) 2013-08-06 2017-04-06 Apple Inc. Auto-activating smart responses based on activities from remote devices
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9966065B2 (en) 2014-05-30 2018-05-08 Apple Inc. Multi-command single utterance input method
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
TWI690814B (zh) * 2017-12-15 2020-04-11 鴻海精密工業股份有限公司 文字資訊處理裝置及方法、電腦存儲介質及移動終端

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3147898B2 (ja) 1990-11-09 2001-03-19 株式会社東芝 音声応答システム
JP3446764B2 (ja) 1991-11-12 2003-09-16 富士通株式会社 音声合成システム及び音声合成サーバ
JPH05260082A (ja) 1992-03-13 1993-10-08 Toshiba Corp テキスト読み上げ装置
DE69326431T2 (de) * 1992-12-28 2000-02-03 Toshiba Kawasaki Kk Spracherkennungs-Schnittstellensystem, das als Fenstersystem und Sprach-Postsystem verwendbar ist
US6151491A (en) * 1995-01-12 2000-11-21 Bell Atlantic Network Services, Inc. Mobile voice message/electronic mail system
JPH08272587A (ja) 1995-03-30 1996-10-18 Sanyo Electric Co Ltd 電子メール音声変換装置
JPH0950586A (ja) 1995-05-29 1997-02-18 Shinko Seisakusho:Kk 顧客大量輸送車両内危機管理システム
KR100194427B1 (ko) * 1995-12-22 1999-06-15 윤종용 전화단말기에서 호출시 발신자번호 음성메세지 발생장치 및 방법
JP3656772B2 (ja) 1995-12-26 2005-06-08 大日本印刷株式会社 熱転写シート、印字物及び記録方法
JP3768612B2 (ja) * 1996-08-20 2006-04-19 キヤノン株式会社 電子メール読み上げ装置および方法
US5915237A (en) * 1996-12-13 1999-06-22 Intel Corporation Representing speech using MIDI
JP3287281B2 (ja) * 1997-07-31 2002-06-04 トヨタ自動車株式会社 メッセージ処理装置
US6081780A (en) * 1998-04-28 2000-06-27 International Business Machines Corporation TTS and prosody based authoring system
US6144938A (en) * 1998-05-01 2000-11-07 Sun Microsystems, Inc. Voice user interface with personality

Also Published As

Publication number Publication date
US6289085B1 (en) 2001-09-11
JPH1138996A (ja) 1999-02-12

Similar Documents

Publication Publication Date Title
JP3224760B2 (ja) 音声メールシステム、音声合成装置およびこれらの方法
US9214154B2 (en) Personalized text-to-speech services
US7693719B2 (en) Providing personalized voice font for text-to-speech applications
US7027568B1 (en) Personal message service with enhanced text to speech synthesis
EP0378694B1 (en) Response control system
US6182041B1 (en) Text-to-speech based reminder system
WO2002011016A9 (en) System and method for personalizing electronic mail messages
US20100153116A1 (en) Method for storing and retrieving voice fonts
US20060224385A1 (en) Text-to-speech conversion in electronic device field
JP3597327B2 (ja) マルチメディア電子メールシステム
JP2001109487A (ja) 電子メールの音声再生装置、その音声再生方法、及び音声再生プログラムを記録した記録媒体
JPH11308270A (ja) 通信システム及びそれに用いられる端末装置
JPH10149361A (ja) 情報処理方法及び装置及び記憶媒体
KR101916107B1 (ko) 통신 단말 및 그 통신 단말의 정보처리 방법
JP4097901B2 (ja) 言語辞書メンテナンス方法および言語辞書メンテナンス装置
JP3999078B2 (ja) 音声データ配信装置及び依頼者端末
JP3433868B2 (ja) 電子メール通信メディア変換システム
JP2000020417A (ja) 情報処理方法及び装置、その記憶媒体
JP2003216186A (ja) 音声データ配信管理システムおよびその方法
JP2001051688A (ja) 音声合成を用いた電子メール読み上げ装置
JPH09258785A (ja) 情報処理方法および情報処理装置
JP3734434B2 (ja) メッセージ生成配信方法及び生成配信システム
JP2003029774A (ja) 音声波形辞書配信システム、音声波形辞書作成装置、及び音声合成端末装置
JP2004185055A (ja) 電子メールシステム及び通信端末
JPH09258764A (ja) 通信装置および通信方法、並びに情報処理装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080824

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees