JP3527401B2 - ボイスメッセージの明瞭度を向上する方法 - Google Patents
ボイスメッセージの明瞭度を向上する方法Info
- Publication number
- JP3527401B2 JP3527401B2 JP35798497A JP35798497A JP3527401B2 JP 3527401 B2 JP3527401 B2 JP 3527401B2 JP 35798497 A JP35798497 A JP 35798497A JP 35798497 A JP35798497 A JP 35798497A JP 3527401 B2 JP3527401 B2 JP 3527401B2
- Authority
- JP
- Japan
- Prior art keywords
- message
- voice
- voice message
- speed
- aloud
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 claims description 18
- 230000008859 change Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 230000026676 system process Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/53—Centralised arrangements for recording incoming messages, i.e. mailbox systems
- H04M3/533—Voice mail systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/64—Automatic arrangements for answering calls; Automatic arrangements for recording messages for absent subscribers; Arrangements for recording conversations
- H04M1/65—Recording arrangements for recording a message from the calling party
- H04M1/6505—Recording arrangements for recording a message from the calling party storing speech in digital form
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/64—Automatic arrangements for answering calls; Automatic arrangements for recording messages for absent subscribers; Arrangements for recording conversations
- H04M1/65—Recording arrangements for recording a message from the calling party
- H04M1/652—Means for playing back the recorded messages by remote control over a telephone line
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Telephonic Communication Services (AREA)
Description
明瞭度を向上するシステムおよび方法に関する。より具
体的には、本発明はボイスメッセージ中の数字の読み上
げをメッセージの他の部分よりもゆっくりとした速度で
再生する再生方法に関する。
いたるところに普及している。多くの企業はその社の電
話網に組み込まれた私有のボイスメールシステムを有し
ている。さらに、多くの一般家庭でも留守番電話を所有
している。電話会社の中にはボイスメッセージサービス
を行うものもある。
ジシステムはユーザに様々な再生オプションを提供して
いる。ユーザはメッセージを数秒巻き戻したり、また進
めたりできる。ユーザはまた再生のスピードを上げたり
もできる。高速ではメッセージを速い速度で聴けるため
効率が向上する。ある特定のメッセージではたいがい通
常より速い再生速度、たとえば通常速度の1.75倍と
いった速度でも意味が理解できるが、メッセージのある
特定の部分はその速度では意味が理解できないこともあ
る。数字情報は特に速い再生速度では理解しがたいかも
しれない。通常速度でさえ、リスナーがよく知らない数
字情報は理解しがたいかもしれない。
は、多くの人々が自分がよく知っている情報、たとえば
電話番号などを早口で言う傾向があるためである。たと
えばメッセージを吹き込む場合には多くの人は意味をは
っきりとさせながらゆっくり話す。しかしながら、その
同じ人が自分にとってよくわかる電話番号を言う時には
話し方が速くなる。したがって、メッセージが再生され
た時、リスナーは数字情報を理解するのが困難になるか
もしれず、メッセージ全体を詳細かつ適切に理解するの
に数回再生して聞き直さねばならないかもしれない。仮
にリスナーが一回目で情報を理解したとしても、その数
字を書き取っているかもしれず、したがって数字情報は
ゆっくりした速度で再生される必要があると考えられ
る。
がメッセージの再生速度を速くしたり遅くしたりするこ
とを可能にしている。そのようなシステムはディーガン
他による米国特許第5386493号「Apparatus And
Method For Playing Back Audio At Faster Or Slower
Rates Without Pitch Distortion」に記載され、ここに
参照される。そのようなシステムではしかしながら、メ
ッセージ全体が選択された速度で再生されるため、リス
ナーが電話番号の部分をゆっくりした速度で再生したく
てもメッセージ全体がゆっくりと再生されることにな
る。この場合ユーザは、せいぜい手動コントロールによ
ってのみメッセージを再生する時にゆっくりしたり速く
したりすることが可能になるにすぎない。
スメッセージを再生するシステムと方法であって、特に
メッセージ中の数字情報の読み上げ部分を自動的にボイ
スメッセージの残りの部分よりもゆっくりとした速度で
再生するシステムと方法に関する。ボイスメッセージシ
ステムはボイスメッセージを受け、また解析する。特
に、本システムは数字情報の読み上げがボイスメッセー
ジに含まれているかどうかを決定し、もし含まれていれ
ばそのメッセージ内での数字情報の相対位置を決定す
る。メッセージシステムはボイスメッセージと位置情報
の両方を記憶装置に記憶する。
タシステムが記憶装置から記憶されたメッセージと位置
情報を取り出す。ボイスメッセージが再生される時、コ
ンピュータシステムは位置情報を処理する。もし、位置
情報がメッセージの特定の箇所に数字情報の読み上げが
含まれていることを示していれば、その箇所が減速され
たスピードで再生される。
含まれている。
ステム図が示されている。電話交換システム110はコ
ールステーション120(電話、コンピュータのワーク
ステーション、ファックスなど)どうしを、およびコー
ルステーションとボイスメッセージシステム130との
間の通信を選択的に接続する。コールステーション12
0はi)メッセージシステムの電話番号を直接ダイヤル
することによって、またはii)メッセージシステム1
30がサポートしている他のコールステーションに接続
出来ない場合(たとえば他のコールステーションが通話
中だったり、所定時間内に「オフフック」状態にならな
い場合、つまり応答が無い場合など)にボイスメッセー
ジシステム130に接続される。交換システム110は
たとえばPBXや電話交換局(中心局、支局)、または
社内電話システムなどでもよく、従来の技術によって一
般に既知のものである。
132と通信するプロセッサ131(音声ユニット13
2は電話をかけてきた者に対してプロセッサ131の制
御の下で音声信号を発生させる)、アナログデジタル
(A/D)コンバータ133、ダイナミックメモリ13
4(たとえばRAMなど)、およびディスクアレイなど
の記憶装置135より成る。
手先に対して電話をしてきた者がメッセージを残す場合
のロジックの流れ全体を示すフローチャートである。通
話中または応答なし状態のため、メッセージシステムが
相手先のボイスメールボックスを持つメッセージシステ
ムに通話者を接続する方法は既知である。
ステム130に(特に相手先のボイスメールボックス
に)接続する際に、メッセージシステム130は(音声
ユニット132を介して)コールステーション120に
対し音声ガイドを再生し、通話者に相手先へのメッセー
ジを残すように促す(ステップ210)。通話者はコー
ルステーション120のマウスピースに向かってメッセ
ージを吹き込む。メッセージを残す通話者は、メッセー
ジを送る相手先が折り返し電話をできるようにメッセー
ジ中に通話者の電話番号を残すこともある。メッセージ
システム130はメッセージが吹き込まれると同時にそ
れを処理し、記憶装置135にそのメッセージを記憶す
る(ステップ212)。特に、メッセージは相手先のメ
ールボックスに「メール」として記憶される。通話者は
その後メッセージを聴いたりメッセージを再録音したり
(ステップ230)、メッセージシステムへの接続を解
除したり(ステップ240)してもよい。
セージを送ったり取り出したりするのにメールボックス
にアクセスする実施の形態のロジック全体が示されてい
る。この場合、ユーザはメッセージシステム130に電
話をし、ユーザのコールステーション120をメッセー
ジシステム130に接続する。メッセージシステムはま
ずログインシーケンスを実行し(ステップ215)、シ
ステムに対してユーザを特定する。ユーザはその後、オ
プションメニューを提供される(ステップ225)。ユ
ーザはメッセージ送信を選んでもよいし(ステップ22
9と239)、録音されたメッセージや他者から送信さ
れたメッセージをきいてもよいし(ステップ227、2
37、247、249)、また個人化(ステップ23
5)のようなメールボックスの他のオプションを実行し
てもよい。オプションの実行の代わりに、または選択し
たオプションを実行したあとで、ユーザは接続解除して
もよい(ステップ255)。
したならば、メッセージシステムはメッセージを送るべ
きアドレスの入力をユーザに促し(ステップ229)、
その後送るべきメッセージを吹き込むように促す。メッ
セージは処理され、録音される(ステップ239)。ユ
ーザはその後、提供されたメニューオプションのいずれ
を実行してもよい(ステップ225)。
を聴くことを選択するならば、ユーザは記憶されている
メッセージの中からメッセージを選択し(ステップ22
7)、再生を制御する再生オプション、たとえばスピー
ドアップやスローダウンといったオプションを選択して
もよい(ステップ237、247)。再生オプションの
設定後、または設定がない場合、メッセージシステムは
選択されたメッセージを取り出し、再生のための処理を
行う(ステップ249)。
などの再生オプションの設定を選択するならば(ステッ
プ237)、メッセージシステムはユーザの好みに応じ
たオプションを設定する(ステップ247)。
録音ステップ(212または239)をより詳細に示し
たものである。メッセージシステム130は通話者のボ
イスメッセージをメッセージ信号の形で受信する(ステ
ップ310)。メッセージ信号はもしもその信号がデジ
タル形式でない場合にはA/Dコンバータによって音声
サンプルより成るデジタル信号に変換され(ステップ3
20)、バッファに蓄積される(ステップ330)。バ
ッファはダイナミックメモリ134の内部か記憶装置1
35にあってもよいし、またはその両方でもよい。
み上げを探してボイスメッセージを解析する。特に、シ
ステム130は数字の読み上げ(たとえば数字の羅列)
がメッセージ中にあるかどうかを決定し、もしあるなら
ばメッセージ中での数字の読み上げ箇所の相対位置を決
定する。実施の形態ではシステム130は一桁ずつの数
字の羅列の読み上げや二桁以上の数字の読み上げ、また
はその両方についてメッセージを検索する(ステップ3
40)。数字の羅列の読み上げとはたとえば「1ー2ー
3」のようなものを含み、二桁以上の数字の読み上げと
は「13」「100」のようなものを含む。それらの両
方とはたとえば「1−800(one-eight-hundred)」や
「27」などのようなものを含む。他の実施の形態では
システム130は一桁の数字の読み上げも、エラーの割
合はふえるものの検索可能である。たとえばシステム1
30は「two]と[to」または[too」や、[f
our」と[for」、[eight」と[ate」の
ような同音語の識別には難があるかもしれない。メッセ
ージシステム130中のプロセッサ131は充分に高速
で、デジタルメッセージ信号を蓄積する必要がないかも
しれない(ステップ330)。その場合にはステップ3
40がステップ320の後にすぐに続いてもよい。
またはパターン認識技術を利用することによって可能で
ある。たとえば数字を読み上げた音声信号サンプルから
成るテンプレートを記憶しておき、これとボイスメッセ
ージの一部を比べて一致がみられればボイスメッセージ
中に数字の読み上げが含まれていることを示す。その他
の技術はリー他による米国特許第5509104号「Sp
eech Recognition Employing Key Word Modeling and N
on-Key Work Modeling」やホアン他による米国特許第4
783804号「Hidden Markov Model Speech Recogni
tion Arrangement」に記載され、両者は本明細で参照さ
れる。
音声サンプルに対し、メッセージシステムはそのサンプ
ルに「1」を付随させる。数字の読み上げ全体は一般的
に少なくとも数個の音声サンプルの長さになるので、数
字の読み上げ部分には1を羅列したストリングが付随す
る。音声サンプルの他の部分に対してはシステムは
「0」を付随させる。したがって、「0」と「1」のビ
ットストリング、すなわちポジションビットストリング
(または信号)が処理されたメッセージの各々に付随す
る(ステップ350)。他の実施の形態では「0」は少
なくとも数字の読み上げ部分を含むサンプルに付随し、
「1」は音声サンプルの残りの部分に付随する。さらに
1ビットが複数の音声サンプルに対応してもいてよい。
メッセージ信号とそれに付随するポジションストリング
は圧縮され、記憶装置135内の適切な場所(メールボ
ックス)に記憶される(ステップ360)。実施の形態
ではメッセージは経済的な理由から記憶される前に圧縮
される。
ーザがボイスメッセージを残したい場合にはメールボッ
クスは相手先のものを使用する。もしユーザが他の者に
ボイスメッセージを送りたい場合にはメールボックスは
ユーザのものを使用する。またはメッセージ信号とポジ
ションビットストリングを電話番号(メールボックス番
号)とともに汎用データベースに記憶させ、データベー
ス管理システムに適切な電話番号(メールボックス番
号)を入力することによってそれらを取り出してもよ
い。
中の数字情報の相対的開始および終了位置が音声サンプ
ルの番号で(たとえば開始1=サンプル12000、終
了1=サンプル16000、開始2=サンプル3000
0、終了2=サンプル30300などのように)単純に
構成されていてもよいし、相対時間で(たとえば開始1
=32.2秒、終了1=40.5秒などのように)構成
されていてもよい。
それに対応するポジションビットストリング420を示
す。ポジションビットストリング420は1より成るサ
ブストリング(430)を含み、これは少なくとも数字
情報の読み上げの一部を含む音声サンプルに対応する。
は、図3のオプション設定ステップ247の詳細を示
す。本実施の形態ではユーザは2つのオプションの設定
ができる。特に、ユーザは「明瞭度向上モード」を使用
したりしなかったりでき、メッセージの再生速度(たと
えば通常の1.25倍、1.5倍、1.75倍など)を
設定したりもできる。「明瞭度向上モード」を使用する
と、メッセージ中に検出されたいかなる数字の読み上げ
も設定後には自動的にメッセージのその他の部分よりも
ゆっくりした速度で再生される。デフォルトの設定では
「明瞭度向上モード」が使用され、メッセージ再生速度
は通常の一倍に設定されている。再生速度が通常の一倍
に設定されていても、「明瞭度向上モード」は数字の羅
列をゆっくりとした速度で、たとえば通常の0.75倍
の速度などで再生する。実施の形態のようなダイヤル式
の電話ではデフォルトのオプションが常に採用される。
0はユーザにデフォルトのオプションを変更するように
促す(ステップ510)。もしユーザがステップ510
のプロンプトに「はい」と返答してデフォルトオプショ
ンの変更を選択するならば、メッセージシステム130
はユーザに「明瞭度向上モード」を不使用にするように
促す。もしユーザがそのようにすることを選択するなら
ばフラッグが適切にリセットされ(ステップ525)、
メッセージシステムは再生速度変更を促す(ステップ5
30)。ユーザは再生速度を変更してもしなくてもよ
い。もし変更しないならばユーザはステップ540に進
み、ステップ550を経てオプション処理を終える。ユ
ーザが再生速度変更を選択すれば、ステップ535にお
いてそれを実行する。たとえば通常の1.5倍や0.7
5倍のように再生速度をいったん変更すると、もう一度
再生速度が変更されるまで使用中の再生速度がその変更
値に保たれる。ユーザはステップ540を終え、オプシ
ョン処理をステップ550で終了する。
速度を直接設定するオプションも提供される。たとえば
通話者は通常の0.75倍、1.5倍、1.25倍の再
生速度を[075」、「150」、「125」のように
プッシュすることで設定してもよい。
再生速度は特定のユーザメールボックスの使用に対して
一定に保たれる。そのような実施の形態ではユーザは毎
回オプション処理をする必要はない。
ーパッドのボタンを押し、(自動音声認識を使用して)
返答をすることで、またはその他の信号体系を介してシ
ステムからのプロンプトに対して返答する。
ジ毎に行われる図3の処理と再生ステップ249の詳細
を示す。ユーザが特定のメッセージを再生することを選
択すると(ステップ227)、メッセージシステム13
0は記憶されていたデジタルメッセージ信号とそれに付
随してそのメッセージ用に記憶されていたポジションビ
ットストリングとを取り出す(ステップ610)。さら
に「明瞭度向上」フラッグと記憶されていた再生速度も
取り出される(ステップ610)。
る(ステップ620)。もし「明瞭度向上」フラッグが
「不使用」に設定されていれば、圧縮されたメッセージ
ならメッセージ全体が解凍され、ステップ610で取り
出された再生速度で音声ユニット132を使用してメッ
セージが再生される(ステップ630)。米国特許第5
386493号にはピッチのゆがみなしに(たとえば高
速でメッセージが再生された場合に「甲高い声」になる
効果を除去して)ゆっくりまたはより速い速度でメッセ
ージを再生する方法が記述されている。
されている場合にはポジションビットストリングが処理
される(ステップ640)。特に、メッセージシステム
130のプロセッサ131はポジションビットストリン
グを解析し、その中に(メッセージ中に数字の読み上げ
が含まれていることを示す)「1」にセットされたビッ
トが含まれていないかどうかを決定する。もしなければ
圧縮されたメッセージの場合はメッセージ全体を解凍
し、音声ユニット132を介してステップ610で取り
出された再生速度で再生する(ステップ630)。
ットされたビットを含む場合はプロセッサ131はメッ
セージシステム130に順に音声サンプルを再生させ、
ポジションビットストリングの0に対応する音声サンプ
ルはステップ610で取り出された再生速度で音声ユニ
ット132を介して再生し、1に対応する音声サンプル
はその再生速度よりもゆっくりとした速度で音声ユニッ
ト132を介して再生する(ステップ650)。ゆっく
りとした速度とはメッセージシステム130によって決
定された速度(固定された速度でもよいし、ステップ6
10で取り出された再生速度のような他のパラメータの
関数)でもよいし、ユーザが設定した速度でもよい。
「1」や「0」がポジションビットストリングに現れそ
れに対応して再生速度が速くなったり遅くなったりする
時は、速度変更による効果がスムーズで耳障りならない
ように再生速度が漸減または漸増する機能を使用しても
よい。
の形態を参照しながら本発明を記載してきたが、当業者
には本発明の考えや範囲からそれることなく様々な変形
が可能であることが理解されるであろう。たとえば、デ
ジタルメッセージは記憶装置135において受け付けら
れ記憶されてもよく、その後リアルタイムでプロセッサ
131によって処理されてもよい。これには特別の回路
が必要で、メッセージシステム130もパワフルなプロ
セッサ(またはマルチプロセッサ)を必要とする。メッ
セージ中の数字の読み上げが再生中に一度検出されたな
らポジション情報は記憶されなくともよい。
合したもの、またはその両方の検出はメッセージの圧縮
の前に行われる。しかしながら、数字の読み上げの検出
はまずメッセージを圧縮してから圧縮された状態でメッ
セージを処理して行ってもよいし、解凍のあとで行って
もよい。
言語解析部分に)充分な演算力があるならば家庭の留守
番電話に組み込まれてもよい。それより処理能力の劣る
プロセッサはバッチモードでメッセージが処理されるの
であれば使用できる可能性がある。
される内容を含んでいる。著作権の所有者は米国特許庁
や特許書類に開示されたとおりに複製することにはなん
らの異議を持たないが、それ以外についてはすべての著
作権を保持している。
す場合のロジックの流れを全体的に示すフローチャート
である。
る場合のロジックの流れを全体的に示すフローチャート
である。
示すフローチャートである。
トストリングの例を示す図である。
フローチャートである。
フローチャートである。
ン、130 ボイスメッセージシステム、131 プロ
セッサ、132 音声ユニット、133 アナログデジ
タルコンバータ、134 ダイナミックメモリ、135
記憶装置。
Claims (5)
- 【請求項1】 ボイスメッセージを記憶し、再生する方
法であって、 a)ボイスメッセージを受け付け、 b)受け付けたメッセージ中に存在する数字の読み上げ
を少なくとも一つ含む部分を検出し、 c)ボイスメッセージを記憶装置に記憶し、 d)ボイスメッセージを記憶装置から取り出し、 e)前記受け付けたメッセージのうち、前記検出された
数字の読み上げを少なくとも一つ含む部分を含まない、
残りの部分を第一の速度で再生し、 f)前記検出された数字の読み上げを少なくとも一つ含
む部分を前記第一の速度よりも遅い第二の速度で再生す
るステップを含み、 さらに、 g)受け付けたボイスメッセージ中の前記検出された数
字の読み上げを少なくとも一つ含む部分の位置を検出
し、 h)検出された位置に関する情報を前記記憶装置に記憶
し、 i)記憶された情報を前記記憶装置から取り出し、 j)前記e)からf)のステップを、取り出された情報
の機能として行うステップとを含むことを特徴とするボ
イスメッセージの記憶再生方法。 - 【請求項2】 請求項1に記載の方法であって、ボイス
メッセージは複数の音声サンプルを含み、前記情報はビ
ットストリングとして記憶され、各ビットは前記ボイス
メッセージ内の少なくとも一つの音声サンプルに付随す
ることを特徴とするボイスメッセージの記憶再生方法。 - 【請求項3】 請求項1に記載の方法であって、前記数
字の読み上げは数字の桁を連結したものを含むことを特
徴とするボイスメッセージの記憶再生方法。 - 【請求項4】 ボイスメッセージの再生方法であって a)ボイスメッセージを受け付け、 b)受け付けたメッセージ中に存在する数字の読み上げ
を少なくとも一つ含む部分を検出し、 c)前記受け付けたメッセージのうち、前記検出された
数字の読み上げを少なくとも一つ含む部分を含まない、
残りの部分を第一の速度で再生し、 d)前記検出された数字の読み上げを少なくとも一つ含
む部分を前記第一の速度よりも遅い第二の速度で再生す
るステップを含み、 さらに、 e)受け付けたボイスメッセージ中の前記検出された数
字の読み上げを少なくとも一つ含む部分の位置を検出
し、 f)検出された位置の関数としてポジション信号を発生
させ、 g)前記c)からd)のステップを、ポジション信号の
機能として行うステップとを含むことを特徴とするボイ
スメッセージの再生方法。 - 【請求項5】 請求項4に記載の方法であって、ボイス
メッセージは複数の音声サンプルを含み、前記ポジショ
ン信号は複数のビットであり、各ビットは前記ボイスメ
ッセージ内の少なくとも一つの音声サンプルに付随する
ことを特徴とするボイスメッセージの再生方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/777,833 | 1996-12-31 | ||
US08/777,833 US5848130A (en) | 1996-12-31 | 1996-12-31 | System and method for enhanced intelligibility of voice messages |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10210154A JPH10210154A (ja) | 1998-08-07 |
JP3527401B2 true JP3527401B2 (ja) | 2004-05-17 |
Family
ID=25111443
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP35798497A Expired - Fee Related JP3527401B2 (ja) | 1996-12-31 | 1997-12-25 | ボイスメッセージの明瞭度を向上する方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US5848130A (ja) |
EP (1) | EP0851404A3 (ja) |
JP (1) | JP3527401B2 (ja) |
CA (1) | CA2218768C (ja) |
Families Citing this family (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6567778B1 (en) | 1995-12-21 | 2003-05-20 | Nuance Communications | Natural language speech recognition using slot semantic confidence scores related to their word recognition confidence scores |
US6195417B1 (en) * | 1997-11-18 | 2001-02-27 | Telecheck International, Inc. | Automated system for accessing speech-based information |
US6219407B1 (en) * | 1998-01-16 | 2001-04-17 | International Business Machines Corporation | Apparatus and method for improved digit recognition and caller identification in telephone mail messaging |
JP3445737B2 (ja) * | 1998-03-20 | 2003-09-08 | シャープ株式会社 | 通信装置 |
US7023968B1 (en) * | 1998-11-10 | 2006-04-04 | Intel Corporation | Message handling system |
US6631368B1 (en) * | 1998-11-13 | 2003-10-07 | Nortel Networks Limited | Methods and apparatus for operating on non-text messages |
US6570964B1 (en) * | 1999-04-16 | 2003-05-27 | Nuance Communications | Technique for recognizing telephone numbers and other spoken information embedded in voice messages stored in a voice messaging system |
US7058573B1 (en) | 1999-04-20 | 2006-06-06 | Nuance Communications Inc. | Speech recognition system to selectively utilize different speech recognition techniques over multiple speech recognition passes |
US6766295B1 (en) | 1999-05-10 | 2004-07-20 | Nuance Communications | Adaptation of a speech recognition system across multiple remote sessions with a speaker |
EP1058446A3 (en) * | 1999-06-03 | 2003-07-09 | Lucent Technologies Inc. | Key segment spotting in voice messages |
US6567506B1 (en) * | 1999-12-02 | 2003-05-20 | Agere Systems Inc. | Telephone number recognition of spoken telephone number in a voice message stored in a voice messaging system |
US7092496B1 (en) * | 2000-09-18 | 2006-08-15 | International Business Machines Corporation | Method and apparatus for processing information signals based on content |
US20060271365A1 (en) * | 2000-09-18 | 2006-11-30 | International Business Machines Corporation | Methods and apparatus for processing information signals based on content |
DE10101121A1 (de) * | 2001-01-05 | 2002-07-11 | Deutsche Telekom Ag | Steuerung von Sprachnachrichten beim Empfänger |
US6889065B2 (en) * | 2001-06-25 | 2005-05-03 | Cingular Wireless Ii, Llc | System and method for providing an adapter module |
US6892051B2 (en) * | 2001-06-25 | 2005-05-10 | Cingular Wireless Ii, Llc | System and method for providing an adapter module |
US7113572B2 (en) * | 2001-10-03 | 2006-09-26 | Cingular Wireless Ii, Llc | System and method for recognition of and automatic connection using spoken address information received in voice mails and live telephone conversations |
US20030081738A1 (en) * | 2001-10-29 | 2003-05-01 | Kohnle Scott E | Method and apparatus for improving access to numerical information in voice messages |
US7440900B2 (en) | 2002-03-15 | 2008-10-21 | Microsoft Corporation | Voice message processing system and method |
JP2004023218A (ja) * | 2002-06-13 | 2004-01-22 | Matsushita Electric Ind Co Ltd | 電話装置 |
GB0228245D0 (en) * | 2002-12-04 | 2003-01-08 | Mitel Knowledge Corp | Apparatus and method for changing the playback rate of recorded speech |
DE10309834A1 (de) * | 2003-03-05 | 2004-09-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren zur Wiedergabe gesprochener Informationen |
US7509255B2 (en) | 2003-10-03 | 2009-03-24 | Victor Company Of Japan, Limited | Apparatuses for adaptively controlling processing of speech signal and adaptively communicating speech in accordance with conditions of transmitting apparatus side and radio wave and methods thereof |
US7478044B2 (en) * | 2004-03-04 | 2009-01-13 | International Business Machines Corporation | Facilitating navigation of voice data |
JP5164041B2 (ja) * | 2008-09-10 | 2013-03-13 | 独立行政法人情報通信研究機構 | 音声合成装置、音声合成方法、及びプログラム |
US9412381B2 (en) * | 2010-03-30 | 2016-08-09 | Ack3 Bionetics Private Ltd. | Integrated voice biometrics cloud security gateway |
US9767807B2 (en) | 2011-03-30 | 2017-09-19 | Ack3 Bionetics Pte Limited | Digital voice signature of transactions |
CN103247290A (zh) * | 2012-02-14 | 2013-08-14 | 富泰华工业(深圳)有限公司 | 通信装置及其控制方法 |
US9916127B1 (en) | 2016-09-14 | 2018-03-13 | International Business Machines Corporation | Audio input replay enhancement with closed captioning display |
US10056080B2 (en) * | 2016-10-18 | 2018-08-21 | Ford Global Technologies, Llc | Identifying contacts using speech recognition |
US10468026B1 (en) * | 2018-08-17 | 2019-11-05 | Century Interactive Company, LLC | Dynamic protection of personal information in audio recordings |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3786195A (en) * | 1971-08-13 | 1974-01-15 | Dc Dt Liquidating Partnership | Variable delay line signal processor for sound reproduction |
US4757525A (en) * | 1982-09-29 | 1988-07-12 | Vmx, Inc. | Electronic audio communications system with voice command features |
US4783804A (en) * | 1985-03-21 | 1988-11-08 | American Telephone And Telegraph Company, At&T Bell Laboratories | Hidden Markov model speech recognition arrangement |
US5027384A (en) * | 1986-09-22 | 1991-06-25 | Dytel Corporation | Personalized automatic call routing |
US5509104A (en) * | 1989-05-17 | 1996-04-16 | At&T Corp. | Speech recognition employing key word modeling and non-key word modeling |
US5222125A (en) * | 1991-09-03 | 1993-06-22 | At&T Bell Laboratories | System for providing personalized telephone calling features |
FR2692070B1 (fr) * | 1992-06-05 | 1996-10-25 | Thomson Csf | Procede et dispositif de synthese vocale a vitesse variable. |
US5386493A (en) * | 1992-09-25 | 1995-01-31 | Apple Computer, Inc. | Apparatus and method for playing back audio at faster or slower rates without pitch distortion |
US5475791A (en) * | 1993-08-13 | 1995-12-12 | Voice Control Systems, Inc. | Method for recognizing a spoken word in the presence of interfering speech |
US5524137A (en) * | 1993-10-04 | 1996-06-04 | At&T Corp. | Multi-media messaging system |
DE4334313A1 (de) * | 1993-10-08 | 1995-04-13 | Sel Alcatel Ag | Verfahren zum Verwalten eines Sprachspeichers und Vorrichtung dafür |
US5493608A (en) * | 1994-03-17 | 1996-02-20 | Alpha Logic, Incorporated | Caller adaptive voice response system |
-
1996
- 1996-12-31 US US08/777,833 patent/US5848130A/en not_active Expired - Fee Related
-
1997
- 1997-10-21 CA CA002218768A patent/CA2218768C/en not_active Expired - Fee Related
- 1997-12-12 EP EP97121959A patent/EP0851404A3/en not_active Ceased
- 1997-12-25 JP JP35798497A patent/JP3527401B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US5848130A (en) | 1998-12-08 |
EP0851404A2 (en) | 1998-07-01 |
CA2218768A1 (en) | 1998-06-30 |
EP0851404A3 (en) | 1998-12-30 |
MX9710468A (es) | 1998-06-30 |
CA2218768C (en) | 2000-12-19 |
JPH10210154A (ja) | 1998-08-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3527401B2 (ja) | ボイスメッセージの明瞭度を向上する方法 | |
KR100205155B1 (ko) | 전화응답 장치 | |
US6519327B1 (en) | System and method for selectively retrieving messages stored on telephony and data networks | |
JP3873131B2 (ja) | 電話メッセージの転記のために使用される編集システム及び方法 | |
US6567506B1 (en) | Telephone number recognition of spoken telephone number in a voice message stored in a voice messaging system | |
GB2406756A (en) | Graphical user interface for managing voicemail for a mobile telephone | |
JPH07183961A (ja) | 音声メッセージシステムに音声メッセージを記憶させる方法 | |
US5949852A (en) | Method for recording messages for absent parties | |
JPH09247264A (ja) | メッセージングシステム用のスクラッチパッド設備 | |
US5655006A (en) | Automated system and method for voice processing | |
US6449342B1 (en) | Recorded voice message summary | |
JP2846817B2 (ja) | 情報処理方法及びデータ処理システム | |
US20060233319A1 (en) | Automatic messaging system | |
US7203286B1 (en) | Method and apparatus for combining ambient sound effects to voice messages | |
JPH10233837A (ja) | 電話応答システムとその使用方法 | |
JPS6046647A (ja) | 電報サ−ビス方式 | |
CA2330981A1 (en) | Method and apparatus for annotated voice mail response | |
JPH08242280A (ja) | 音声メール装置 | |
MXPA97010468A (en) | System and method for enhanced intelligibility of voice messages | |
JPH05103076A (ja) | 留守番電話装置 | |
JPH0981200A (ja) | 通信器 | |
JPH03162165A (ja) | 留守番電話機 | |
US20010016033A1 (en) | Audio storage apparatus | |
JPH08195815A (ja) | Lanシステム | |
JPH04306947A (ja) | 音声蓄積装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20031202 |
|
A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20031216 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040120 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040219 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090227 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090227 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100227 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110227 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |