JP2001005481A - 音声メッセージ中のキーセグメントにスポットをあてる方法。 - Google Patents
音声メッセージ中のキーセグメントにスポットをあてる方法。Info
- Publication number
- JP2001005481A JP2001005481A JP2000166995A JP2000166995A JP2001005481A JP 2001005481 A JP2001005481 A JP 2001005481A JP 2000166995 A JP2000166995 A JP 2000166995A JP 2000166995 A JP2000166995 A JP 2000166995A JP 2001005481 A JP2001005481 A JP 2001005481A
- Authority
- JP
- Japan
- Prior art keywords
- segment
- key segment
- key
- message
- voice message
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 27
- 238000001514 detection method Methods 0.000 abstract description 13
- 238000010586 diagram Methods 0.000 description 2
- 241000286209 Phasianidae Species 0.000 description 1
- 244000028344 Primula vulgaris Species 0.000 description 1
- 235000016311 Primula vulgaris Nutrition 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/53—Centralised arrangements for recording incoming messages, i.e. mailbox systems
- H04M3/533—Voice mail systems
- H04M3/53333—Message receiving aspects
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/187—Phonemic context, e.g. pronunciation rules, phonotactical constraints or phoneme n-grams
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/40—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2203/00—Aspects of automatic or semi-automatic exchanges
- H04M2203/30—Aspects of automatic or semi-automatic exchanges related to audio recordings in general
- H04M2203/303—Marking
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
(57)【要約】
【課題】 音声メッセージ中のキー情報を含むセグメン
トを特定して取り出す方法とシステムを提供すること。 【解決手段】 キーセグメントを特定するステップと、
音声メッセージを受信するステップと、音声メッセージ
中にキーセグメントを検出するステップと、音声メッセ
ージ中に検出されたキーセグメントの位置を示すために
音声メッセージにタグを付すステップと、キーセグメン
トを検索するために問い合わせ事項を受領するステップ
と、音声メッセージからキーセグメントを取り出すステ
ップとを有し、音声メッセージ中にキーセグメントにス
ポットをあてることを特徴とする。
トを特定して取り出す方法とシステムを提供すること。 【解決手段】 キーセグメントを特定するステップと、
音声メッセージを受信するステップと、音声メッセージ
中にキーセグメントを検出するステップと、音声メッセ
ージ中に検出されたキーセグメントの位置を示すために
音声メッセージにタグを付すステップと、キーセグメン
トを検索するために問い合わせ事項を受領するステップ
と、音声メッセージからキーセグメントを取り出すステ
ップとを有し、音声メッセージ中にキーセグメントにス
ポットをあてることを特徴とする。
Description
【0001】
【発明の属する技術分野】本発明は音声メッセージシス
テムに関し、特に音声メッセージ中のキーセグメントを
特定する方法に関する。
テムに関し、特に音声メッセージ中のキーセグメントを
特定する方法に関する。
【0002】
【従来の技術】音声メッセージ(ボイスメール)システ
ムにおいては、ユーザーは複数の時には長いメッセージ
を聞いてメッセージを残した発呼者の名前及び電話番号
のような情報の様々な項目を得ている。この手順は、時
間のかかるプロセスであり、またさらに必要な情報を記
述する。手書きで書き込むとエラーを含みやすい。
ムにおいては、ユーザーは複数の時には長いメッセージ
を聞いてメッセージを残した発呼者の名前及び電話番号
のような情報の様々な項目を得ている。この手順は、時
間のかかるプロセスであり、またさらに必要な情報を記
述する。手書きで書き込むとエラーを含みやすい。
【0003】
【発明が解決しようとする課題】本発明は、音声メッセ
ージ中のキー情報を含むセグメントを特定して取り出す
方法とシステムを提供することである。
ージ中のキー情報を含むセグメントを特定して取り出す
方法とシステムを提供することである。
【0004】
【課題を解決するための手段】本発明の方法は、例えば
私の名前は○○です。(あるいはこちらは○○です。)
のようなセグメントの存在を検出し認証することにより
音声メッセージ中の名前のセグメントにスポットをあて
る。本発明の方法は、「私の電話番号は○○です。」あ
るいは、「電話を私のところにかけてきてください。」
あるいは、「私の電話番号は3647589」のような
メッセージの数字の部分にスポットをあてて、そのセグ
メントを検出し認証することにより、電話番号のセグメ
ント(部分)を取り出すものである。目的とするキーセ
グメントにスポットがあてられると、本発明の方法は、
ユーザー(被呼者)にキーセグメント中に含まれる関連
情報(例えば発呼者の名前)のみをユーザーに与える。
本発明の方法は、キーセグメントにスポットをあて、必
要なセグメントのみを取り出すことができるものであ
る。これによりメッセージを取り出したユーザーは、メ
ッセージの残りの部分を聞くことなしにメッセージの所
望の部分だけを聞くことができる。
私の名前は○○です。(あるいはこちらは○○です。)
のようなセグメントの存在を検出し認証することにより
音声メッセージ中の名前のセグメントにスポットをあて
る。本発明の方法は、「私の電話番号は○○です。」あ
るいは、「電話を私のところにかけてきてください。」
あるいは、「私の電話番号は3647589」のような
メッセージの数字の部分にスポットをあてて、そのセグ
メントを検出し認証することにより、電話番号のセグメ
ント(部分)を取り出すものである。目的とするキーセ
グメントにスポットがあてられると、本発明の方法は、
ユーザー(被呼者)にキーセグメント中に含まれる関連
情報(例えば発呼者の名前)のみをユーザーに与える。
本発明の方法は、キーセグメントにスポットをあて、必
要なセグメントのみを取り出すことができるものであ
る。これによりメッセージを取り出したユーザーは、メ
ッセージの残りの部分を聞くことなしにメッセージの所
望の部分だけを聞くことができる。
【0005】本発明は、大量のボイスメールメッセージ
を分類分けするのに用いることができる。本発明の方法
は、メッセージ内のある種のセグメント、あるいは特定
の発呼者からのメッセージを検索するプロセスをスピー
ドアップできる。
を分類分けするのに用いることができる。本発明の方法
は、メッセージ内のある種のセグメント、あるいは特定
の発呼者からのメッセージを検索するプロセスをスピー
ドアップできる。
【0006】
【発明の実施の形態】本発明の一実施例においては、キ
ーセグメントにスポットをあてることはメッセージ中に
スポットをあてたいキーセグメントをユーザーが最初に
登録することにより行われる。この手順を図1に示す。
同図においてキーセグメントの登録はテキスト入力(キ
ーボードが利用できる場合にはユーザーは登録するべき
キーセグメントをタイプする)か、あるいは音声入力
(例;ユーザーが登録すべきキーセグメントを話す)に
より行うことができる。
ーセグメントにスポットをあてることはメッセージ中に
スポットをあてたいキーセグメントをユーザーが最初に
登録することにより行われる。この手順を図1に示す。
同図においてキーセグメントの登録はテキスト入力(キ
ーボードが利用できる場合にはユーザーは登録するべき
キーセグメントをタイプする)か、あるいは音声入力
(例;ユーザーが登録すべきキーセグメントを話す)に
より行うことができる。
【0007】ユーザーは、音声メッセージの一部を用い
てキーセグメントを登録することもできる。図1に示す
ように、ユーザーは、録音された音声メッセージを再生
しながら、セグメント内のキーメッセージの先頭に
「B」キーをマークすることにより、そして末尾に
「E」キーをマークすることによりセグメントB/Eマ
ークを13でマークすることができる。さらにキーシー
ケンス、例えば「★★S」を押すことによりユーザー
は、マークされたセグメント(BキーとEキー)を押す
ことにより囲まれた部分が登録されることを表すことが
できる。この特徴は、後で名前等にスポットをあてるた
めに送信者(発呼者)により話されたメッセージの送信
者の名前をセーブしておくのに有効である。
てキーセグメントを登録することもできる。図1に示す
ように、ユーザーは、録音された音声メッセージを再生
しながら、セグメント内のキーメッセージの先頭に
「B」キーをマークすることにより、そして末尾に
「E」キーをマークすることによりセグメントB/Eマ
ークを13でマークすることができる。さらにキーシー
ケンス、例えば「★★S」を押すことによりユーザー
は、マークされたセグメント(BキーとEキー)を押す
ことにより囲まれた部分が登録されることを表すことが
できる。この特徴は、後で名前等にスポットをあてるた
めに送信者(発呼者)により話されたメッセージの送信
者の名前をセーブしておくのに有効である。
【0008】一般的に用いられるキーセグメント、例え
ば名前のセグメント、電話番号のセグメント、データセ
グメントは、所定のセグメントとして登録することなし
に提供される。以下に議論するようにこのような所定の
セグメントは、所定のキーシーケンスを押すことにより
取り出すことができる。
ば名前のセグメント、電話番号のセグメント、データセ
グメントは、所定のセグメントとして登録することなし
に提供される。以下に議論するようにこのような所定の
セグメントは、所定のキーシーケンスを押すことにより
取り出すことができる。
【0009】図1に示すようにユーザーは登録すべきキ
ーセグメント、例えばテキスト、音声、発声等をメッセ
ージ内にセグメントをマークすることにより入力でき
る。テキストは、例えば英数字キーパッド(図示せず)
や、キーボードあるいは他のこのようなテキスト入力デ
バイスを用いて入力できる。キーセグメントの音声表示
は例えば、電話機の音声パス(ユーザーが本発明のシス
テムにダイヤルで入力する)のような音声パスで入力を
することができる。発音は例えば、IPAシンボルセッ
トのようなシンボルの組を用いて特定できる。このよう
なシンボルはテキストとして入力される。
ーセグメント、例えばテキスト、音声、発声等をメッセ
ージ内にセグメントをマークすることにより入力でき
る。テキストは、例えば英数字キーパッド(図示せず)
や、キーボードあるいは他のこのようなテキスト入力デ
バイスを用いて入力できる。キーセグメントの音声表示
は例えば、電話機の音声パス(ユーザーが本発明のシス
テムにダイヤルで入力する)のような音声パスで入力を
することができる。発音は例えば、IPAシンボルセッ
トのようなシンボルの組を用いて特定できる。このよう
なシンボルはテキストとして入力される。
【0010】テキストとしてキーセグメントが入力され
た場合には、そのテキストは、テキスト−音声フロント
エンド11で処理してキーセグメントの発音を得る。例
えば、ユーザーが単語fourを入力した場合には、テ
キスト−音声フロントエンド11は、その発音を表すI
PAシンボルのシーケンスf−ow−rを生成する。ユ
ーザーがメッセージ中でキーセグメントを話したり、あ
るいはキーセグメントをマークしたりするとキーセグメ
ントは、音声認識12を用いて処理してその発音を生成
する。
た場合には、そのテキストは、テキスト−音声フロント
エンド11で処理してキーセグメントの発音を得る。例
えば、ユーザーが単語fourを入力した場合には、テ
キスト−音声フロントエンド11は、その発音を表すI
PAシンボルのシーケンスf−ow−rを生成する。ユ
ーザーがメッセージ中でキーセグメントを話したり、あ
るいはキーセグメントをマークしたりするとキーセグメ
ントは、音声認識12を用いて処理してその発音を生成
する。
【0011】キーセグメントの識別子(例セグメント
名)とキーセグメントの対応する特徴(例;発音)がセ
グメント名と特徴(発音)15内に記憶される。テキス
ト−音声機能と音声認識機能は、従来公知の方法とシス
テムで実現できる。これらの音声認識機能12は、米国
特許第4,713,777号,4,718,088号,
5,509,104号,5,579,436号,5,6
49,057号に記載されている。テキスト−音声機能
は、“Multilingual Text−to−S
peech Synthesis; The Bell
Labs Approach,”by R.W.Sp
roat,Kluwer Academic Publ
ishers,1998に記載されている。
名)とキーセグメントの対応する特徴(例;発音)がセ
グメント名と特徴(発音)15内に記憶される。テキス
ト−音声機能と音声認識機能は、従来公知の方法とシス
テムで実現できる。これらの音声認識機能12は、米国
特許第4,713,777号,4,718,088号,
5,509,104号,5,579,436号,5,6
49,057号に記載されている。テキスト−音声機能
は、“Multilingual Text−to−S
peech Synthesis; The Bell
Labs Approach,”by R.W.Sp
roat,Kluwer Academic Publ
ishers,1998に記載されている。
【0012】音声メッセージを受領するとこのメッセー
ジは、図2に示す方法で処理され登録された及び/又
は、あらかじめ規定されたキーセグメントを検索する。
記憶装置15に記録されたキーセグメントの特徴と、話
し手とは独立したモデル(発音の音声ユニットに対し)
を用いてキーセグメントの検出が21で実行され、音声
メッセージ中に登録された、又はあらかじめ規定された
キーセグメントにスポットをあてる。キーセグメントの
検出21で実行されるキーセグメントの検出は、例えば
米国特許第5,509,104号に記載された従来のワ
ードスポットあるいは移送検出技術により実行される。
ジは、図2に示す方法で処理され登録された及び/又
は、あらかじめ規定されたキーセグメントを検索する。
記憶装置15に記録されたキーセグメントの特徴と、話
し手とは独立したモデル(発音の音声ユニットに対し)
を用いてキーセグメントの検出が21で実行され、音声
メッセージ中に登録された、又はあらかじめ規定された
キーセグメントにスポットをあてる。キーセグメントの
検出21で実行されるキーセグメントの検出は、例えば
米国特許第5,509,104号に記載された従来のワ
ードスポットあるいは移送検出技術により実行される。
【0013】キーセグメントの検出、あるいは発声の認
証の精度を高めることは、キーセグメントの検出21で
検出されたキーセグメントの発声認証機能23で実行さ
れる。発声認証機能を用いてキーセグメント検出機能2
1で検出されたセグメントが探している情報を含むこと
を確認する。発声認証機能23は、米国特許第5,67
5,706号に開示されている。その後このメッセージ
はタグ付きメッセージ25でタグが付けられて、キーセ
グメントとメッセージ中のキーセグメントの位置がその
取り出しを容易にしている。本発明の一実施例において
は、各メッセージは、タグ情報を含むヘッダーを具備し
て登録される。例えばこのタグ情報は、メッセージ中で
検出されたキーセグメントの位置を表す。各キーセグメ
ントの位置は、時間のオフセット、あるいはメッセージ
の開始点からのアドレススペースとして表すことができ
る。
証の精度を高めることは、キーセグメントの検出21で
検出されたキーセグメントの発声認証機能23で実行さ
れる。発声認証機能を用いてキーセグメント検出機能2
1で検出されたセグメントが探している情報を含むこと
を確認する。発声認証機能23は、米国特許第5,67
5,706号に開示されている。その後このメッセージ
はタグ付きメッセージ25でタグが付けられて、キーセ
グメントとメッセージ中のキーセグメントの位置がその
取り出しを容易にしている。本発明の一実施例において
は、各メッセージは、タグ情報を含むヘッダーを具備し
て登録される。例えばこのタグ情報は、メッセージ中で
検出されたキーセグメントの位置を表す。各キーセグメ
ントの位置は、時間のオフセット、あるいはメッセージ
の開始点からのアドレススペースとして表すことができ
る。
【0014】登録された、あるいは所定のキーセグメン
トが検出されないメッセージは、タグを移さずに従来方
法で記憶され、従来方法で取り出すことができる。
トが検出されないメッセージは、タグを移さずに従来方
法で記憶され、従来方法で取り出すことができる。
【0015】メッセージにタグが付けられ、そして登録
されるとメッセージ内のメッセージ及び/又はキーセグ
メントは取り出すことができる。本発明によるメッセー
ジの取り出し手順を図3に示す。
されるとメッセージ内のメッセージ及び/又はキーセグ
メントは取り出すことができる。本発明によるメッセー
ジの取り出し手順を図3に示す。
【0016】この取り出し手順は、ユーザーがキーセグ
メントの問い合わせ項目を入力することにより開始す
る。この問い合わせ項目は、様々な手段(例えば音声す
なわち所望のキーセグメントを話すこと)により、また
はキーセグメントの名前または発音あるいは、キーパッ
ド上で一連のボタンを押すことにより、そしてこの一連
のボタンの入力が所望のキーセグメントを特定する。
メントの問い合わせ項目を入力することにより開始す
る。この問い合わせ項目は、様々な手段(例えば音声す
なわち所望のキーセグメントを話すこと)により、また
はキーセグメントの名前または発音あるいは、キーパッ
ド上で一連のボタンを押すことにより、そしてこの一連
のボタンの入力が所望のキーセグメントを特定する。
【0017】ユーザーがキーセグメントの問い合わせ事
項を受け取ると、本発明の手順ではユーザーが音声によ
り、すなわちユーザーがキーセグメントの名前を話すこ
とにより、ユーザーは問い合わせ事項を入力する。もし
そのような場合操作手順はセグメント名を見い出すため
の音声認識33に進み、そこで音声認識が話された問い
合わせ事項上で実行されて、話されたセグメント名を決
定する。
項を受け取ると、本発明の手順ではユーザーが音声によ
り、すなわちユーザーがキーセグメントの名前を話すこ
とにより、ユーザーは問い合わせ事項を入力する。もし
そのような場合操作手順はセグメント名を見い出すため
の音声認識33に進み、そこで音声認識が話された問い
合わせ事項上で実行されて、話されたセグメント名を決
定する。
【0018】操作は、所定のあるいは登録されたセグメ
ントか35に進みそこで特定されたキーセグメントは、
所定のすなわちすでに登録されたものか否かが決定され
る。ユーザーの問い合わせたキーセグメントが登録され
ているか、あるいは所定のセグメントの一つの場合に
は、操作はタグ付きメッセージ37に進み、そこで特定
されたキーセグメントの検索がタグの付けられたメッセ
ージで実行される。タグ付きメッセージ37において特
定されたキーセグメントがメッセージから取り出され
る。入力されたキーセグメントが複数のメッセージ内に
見い出された場合には、キーセグメントの各発声が繰り
返される。
ントか35に進みそこで特定されたキーセグメントは、
所定のすなわちすでに登録されたものか否かが決定され
る。ユーザーの問い合わせたキーセグメントが登録され
ているか、あるいは所定のセグメントの一つの場合に
は、操作はタグ付きメッセージ37に進み、そこで特定
されたキーセグメントの検索がタグの付けられたメッセ
ージで実行される。タグ付きメッセージ37において特
定されたキーセグメントがメッセージから取り出され
る。入力されたキーセグメントが複数のメッセージ内に
見い出された場合には、キーセグメントの各発声が繰り
返される。
【0019】所定のキーセグメントにアクセスするため
にユーザーの電話番号、例えば電話番号のセグメントに
対しては★印が2つの★★Tで、名前のセグメントに対
しては★★Nで、データセグメントに対しては★★Dの
ような所定のキーシーケンスを押す。さらに★★Tでの
電話番号の検出は、その番号の認証も含む。メッセージ
のセグメントから取り出した番号は、所定のキーシーケ
ンス(例;★★C)を押すことによりダイヤルすること
もできる。
にユーザーの電話番号、例えば電話番号のセグメントに
対しては★印が2つの★★Tで、名前のセグメントに対
しては★★Nで、データセグメントに対しては★★Dの
ような所定のキーシーケンスを押す。さらに★★Tでの
電話番号の検出は、その番号の認証も含む。メッセージ
のセグメントから取り出した番号は、所定のキーシーケ
ンス(例;★★C)を押すことによりダイヤルすること
もできる。
【0020】ユーザーの問い合わせ事項に関連するキー
セグメントが、新たなキーセグメントであると所定のあ
るいは登録されたセグメントか35で決定された場合に
は(すなわち所定のセグメントあるいは登録したセグメ
ントでない場合)キーセグメントの特徴(例;発音)が
図1の手順のセグメントの発音をみいだす36でまず得
られ、その後この記憶されたメッセージにメッセージに
タグを付す38で図2のメッセージ処理で手順に示すよ
うにメッセージにタグを付す38でタグが付けられ、新
たに指定されたキーセグメントが登録されたメッセージ
のどこに見い出されたかを示す。メッセージが新たなキ
ーセグメントでもってタグが付された場合には、このキ
ーセグメントは上記したようにメッセージセグメントの
取り出し39で取り出される。
セグメントが、新たなキーセグメントであると所定のあ
るいは登録されたセグメントか35で決定された場合に
は(すなわち所定のセグメントあるいは登録したセグメ
ントでない場合)キーセグメントの特徴(例;発音)が
図1の手順のセグメントの発音をみいだす36でまず得
られ、その後この記憶されたメッセージにメッセージに
タグを付す38で図2のメッセージ処理で手順に示すよ
うにメッセージにタグを付す38でタグが付けられ、新
たに指定されたキーセグメントが登録されたメッセージ
のどこに見い出されたかを示す。メッセージが新たなキ
ーセグメントでもってタグが付された場合には、このキ
ーセグメントは上記したようにメッセージセグメントの
取り出し39で取り出される。
【0021】キーセグメントがメッセージからメッセー
ジセグメントの取り出し39で取り出されたときには、
ユーザーは所定のキーシーケンス(例;★★S)を押す
ことによりキーセグメントとして将来使用するために、
取り出されたキーセグメントを保存することもできる。
さらにまた名前のセグメントが取り出された場合には、
発呼者を特定することができ、そしてこれを用いてメッ
セージをフィルタ処理すること、あるいは発呼者に従っ
てメッセージを分類することが行われる。これにより本
発明のシステムは、メッセージの送信者(発呼者)の名
前をそれ自身の声でもって、保存して送信者のメッセー
ジを取り出したり、特定しタグを付け取り出すことが後
でできるようになる。
ジセグメントの取り出し39で取り出されたときには、
ユーザーは所定のキーシーケンス(例;★★S)を押す
ことによりキーセグメントとして将来使用するために、
取り出されたキーセグメントを保存することもできる。
さらにまた名前のセグメントが取り出された場合には、
発呼者を特定することができ、そしてこれを用いてメッ
セージをフィルタ処理すること、あるいは発呼者に従っ
てメッセージを分類することが行われる。これにより本
発明のシステムは、メッセージの送信者(発呼者)の名
前をそれ自身の声でもって、保存して送信者のメッセー
ジを取り出したり、特定しタグを付け取り出すことが後
でできるようになる。
【0022】本発明では、メッセージ中のキーセグメン
トにスポットをあてるために音声認識、単語のスポット
かキーワード検出、発声認証技術を用いている。さらに
また符号化されたボイスメールメッセージ中のキーセグ
メントにスポットをあてるために音声符号化技術を用い
ることもできる。
トにスポットをあてるために音声認識、単語のスポット
かキーワード検出、発声認証技術を用いている。さらに
また符号化されたボイスメールメッセージ中のキーセグ
メントにスポットをあてるために音声符号化技術を用い
ることもできる。
【0023】本発明は、AUDIXシステムのようなボ
イスメッセージシステムの一部として実現できる。更に
また本発明は、汎用コンピュータあるいは特定の目的を
有する専用のハードウエアあるいはソフトウエアで実現
できる。
イスメッセージシステムの一部として実現できる。更に
また本発明は、汎用コンピュータあるいは特定の目的を
有する専用のハードウエアあるいはソフトウエアで実現
できる。
【図1】本発明によるキーセグメント登録手順を表す図
【図2】本発明によるボイスメッセージの処理を表す図
【図3】本発明によるメッセージ及びキーセグメントの
取り出し手順を表す図
取り出し手順を表す図
11 テキスト−スピーチフロントエンド 12 音声認識 13 セグメントB/Eをマークする 15 セグメント名と特徴(発音) 15 記憶装置 21 キーセグメントの検出 23 発音認証 25 タグ付きメッセージ 31 音声入力としてのセグメント名か 33 セグメント名を見い出すための音声認識 35 所定のあるいは登録されたセグメントか 36 セグメントの発音を見出す 37 タグ付きメッセージ 39 メッセージセグメントの取り出し 38 メッセージにタグを付す
───────────────────────────────────────────────────── フロントページの続き (71)出願人 596077259 600 Mountain Avenue, Murray Hill, New Je rsey 07974−0636U.S.A. (72)発明者 チン−フイ リー アメリカ合衆国、07920 ニュージャージ ー、バスキング リッジ、フェザント ラ ン ドライブ 44 (72)発明者 ラドマ ラメシュ アメリカ合衆国、07974 ニュージャージ ー、ニュー プロビデンス、プリムローズ ドライブ 70
Claims (8)
- 【請求項1】 (A) キーセグメントを特定するス
テップと、 (B) 音声メッセージを受信するステップと、 (C) 音声メッセージ中にキーセグメントを検出する
ステップと、 (D) 音声メッセージ中に検出されたキーセグメント
の位置を示すために音声メッセージにタグを付すステッ
プと、 (E) キーセグメントを検索するために問い合わせ事
項を受領するステップと、 (F) 音声メッセージからキーセグメントを取り出す
ステップと、を有することを特徴とする音声メッセージ
中のキーセグメントにスポットをあてる方法。 - 【請求項2】 前記(A)ステップは、キーセグメント
の識別子と特徴を記憶することによりキーセグメントを
登録するステップを含むことを特徴とする請求項1記載
の方法。 - 【請求項3】 前記(A)ステップは、キーセグメント
をあらかじめ規定するステップを含むことを特徴とする
請求項1記載の方法。 - 【請求項4】 前記キーセグメントの問い合わせ事項
は、音声を含むことを特徴とする請求項1記載の方法。 - 【請求項5】 前記キーセグメントの特徴は、キーセグ
メントの発音を含むことを特徴とする請求項2記載の方
法。 - 【請求項6】 (A) 音声メッセージを受領するス
テップと、 (B) キーセグメントの問い合わせ事項を受領するス
テップと、 (C) 音声メッセージ中にキーセグメントを検出する
ステップと、 (D) 検出されたキーセグメントの位置で音声メッセ
ージにタグを付すステップと、 (E) 音声メッセージからキーセグメントを取り出す
ステップと、を有することを特徴とする音声メッセージ
中のキーセグメントにスポットをあてる方法。 - 【請求項7】 (F) キーセグメントの識別子と特
徴を記憶することによりキーセグメントを登録するステ
ップと、を有することを特徴とする請求項6記載の方
法。 - 【請求項8】 前記キーセグメントの特徴は、キーセ
グメントの発音を含むことを特徴とする請求項7記載の
方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US32514399A | 1999-06-03 | 1999-06-03 | |
US09/325143 | 1999-06-03 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2001005481A true JP2001005481A (ja) | 2001-01-12 |
Family
ID=23266616
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000166995A Pending JP2001005481A (ja) | 1999-06-03 | 2000-06-05 | 音声メッセージ中のキーセグメントにスポットをあてる方法。 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20050129188A1 (ja) |
EP (1) | EP1058446A3 (ja) |
JP (1) | JP2001005481A (ja) |
KR (1) | KR20010007210A (ja) |
CA (1) | CA2310176A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002297639A (ja) * | 2001-03-29 | 2002-10-11 | Kddi Corp | 音声文書変換装置 |
JP2018044162A (ja) * | 2016-09-13 | 2018-03-22 | 中国塗料株式会社 | 変性アクリル樹脂系塗料組成物、積層塗膜、塗膜付き基材およびその製造方法 |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2373670B (en) | 2001-03-20 | 2005-09-21 | Mitel Knowledge Corp | Method and apparatus for extracting voiced telephone numbers and email addresses from voice mail messages |
GB0108603D0 (en) * | 2001-04-05 | 2001-05-23 | Moores Toby | Voice recording methods and systems |
US20030048881A1 (en) * | 2001-09-13 | 2003-03-13 | Koninklijke Philips Electronics N.V. | Method and apparatus for presenting information from telephone messages to a user |
US7729478B1 (en) * | 2005-04-12 | 2010-06-01 | Avaya Inc. | Change speed of voicemail playback depending on context |
US20060246891A1 (en) * | 2005-04-29 | 2006-11-02 | Alcatel | Voice mail with phone number recognition system |
TWI270052B (en) * | 2005-08-09 | 2007-01-01 | Delta Electronics Inc | System for selecting audio content by using speech recognition and method therefor |
US20070286398A1 (en) * | 2006-06-07 | 2007-12-13 | Venkatesan Ramamoorthy | Voice Recognition Dialing For Alphabetic Phone Numbers |
US20070286399A1 (en) * | 2006-06-07 | 2007-12-13 | Venkatesan Ramamoorthy | Phone Number Extraction System For Voice Mail Messages |
WO2009038882A1 (en) * | 2007-08-02 | 2009-03-26 | Nexidia, Inc. | Control and configuration of a speech recognizer by wordspotting |
CN101478447B (zh) * | 2009-01-08 | 2011-01-05 | 中国人民解放军信息工程大学 | 一种深度报文检测方法和装置 |
US8638911B2 (en) | 2009-07-24 | 2014-01-28 | Avaya Inc. | Classification of voice messages based on analysis of the content of the message and user-provisioned tagging rules |
US10733989B2 (en) * | 2016-11-30 | 2020-08-04 | Dsp Group Ltd. | Proximity based voice activation |
US10311874B2 (en) | 2017-09-01 | 2019-06-04 | 4Q Catalyst, LLC | Methods and systems for voice-based programming of a voice-controlled device |
CN109729425B (zh) * | 2017-10-27 | 2021-05-18 | 优酷网络技术(北京)有限公司 | 一种关键片段的预测方法及系统 |
CN114697202B (zh) * | 2020-12-31 | 2023-09-29 | 华为技术有限公司 | 一种检测方法及装置 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9408042D0 (en) * | 1994-04-22 | 1994-06-15 | Hewlett Packard Co | Device for managing voice data |
JPH08314490A (ja) * | 1995-05-23 | 1996-11-29 | Nippon Hoso Kyokai <Nhk> | ワードスポッティング型音声認識方法と装置 |
US5797124A (en) * | 1996-05-30 | 1998-08-18 | Intervoice Limited Partnership | Voice-controlled voice mail having random-order message retrieval based on played spoken identifier list |
US5822405A (en) * | 1996-09-16 | 1998-10-13 | Toshiba America Information Systems, Inc. | Automated retrieval of voice mail using speech recognition |
US5797123A (en) * | 1996-10-01 | 1998-08-18 | Lucent Technologies Inc. | Method of key-phase detection and verification for flexible speech understanding |
US5732216A (en) * | 1996-10-02 | 1998-03-24 | Internet Angles, Inc. | Audio message exchange system |
US5848130A (en) * | 1996-12-31 | 1998-12-08 | At&T Corp | System and method for enhanced intelligibility of voice messages |
US6035017A (en) * | 1997-01-24 | 2000-03-07 | Lucent Technologies Inc. | Background speech recognition for voice messaging applications |
US6219407B1 (en) * | 1998-01-16 | 2001-04-17 | International Business Machines Corporation | Apparatus and method for improved digit recognition and caller identification in telephone mail messaging |
US6233553B1 (en) * | 1998-09-04 | 2001-05-15 | Matsushita Electric Industrial Co., Ltd. | Method and system for automatically determining phonetic transcriptions associated with spelled words |
US6631368B1 (en) * | 1998-11-13 | 2003-10-07 | Nortel Networks Limited | Methods and apparatus for operating on non-text messages |
US6249765B1 (en) * | 1998-12-22 | 2001-06-19 | Xerox Corporation | System and method for extracting data from audio messages |
US6463143B2 (en) * | 1999-04-16 | 2002-10-08 | Ameritech Corporation | Method system and article for audibly identifying a called party |
US6570964B1 (en) * | 1999-04-16 | 2003-05-27 | Nuance Communications | Technique for recognizing telephone numbers and other spoken information embedded in voice messages stored in a voice messaging system |
-
2000
- 2000-05-23 EP EP00304356A patent/EP1058446A3/en not_active Withdrawn
- 2000-05-29 CA CA002310176A patent/CA2310176A1/en not_active Abandoned
- 2000-06-02 KR KR1020000030393A patent/KR20010007210A/ko not_active Application Discontinuation
- 2000-06-05 JP JP2000166995A patent/JP2001005481A/ja active Pending
-
2005
- 2005-02-02 US US11/049,347 patent/US20050129188A1/en not_active Abandoned
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002297639A (ja) * | 2001-03-29 | 2002-10-11 | Kddi Corp | 音声文書変換装置 |
JP2018044162A (ja) * | 2016-09-13 | 2018-03-22 | 中国塗料株式会社 | 変性アクリル樹脂系塗料組成物、積層塗膜、塗膜付き基材およびその製造方法 |
JP7028591B2 (ja) | 2016-09-13 | 2022-03-02 | 中国塗料株式会社 | 変性アクリル樹脂系塗料組成物、積層塗膜、塗膜付き基材およびその製造方法 |
Also Published As
Publication number | Publication date |
---|---|
EP1058446A3 (en) | 2003-07-09 |
EP1058446A2 (en) | 2000-12-06 |
CA2310176A1 (en) | 2000-12-03 |
US20050129188A1 (en) | 2005-06-16 |
KR20010007210A (ko) | 2001-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20050129188A1 (en) | Key segment spotting in voice messages | |
US6219407B1 (en) | Apparatus and method for improved digit recognition and caller identification in telephone mail messaging | |
US6785367B2 (en) | Method and apparatus for extracting voiced telephone numbers and email addresses from voice mail messages | |
US7013280B2 (en) | Disambiguation method and system for a voice activated directory assistance system | |
US5797124A (en) | Voice-controlled voice mail having random-order message retrieval based on played spoken identifier list | |
US6775360B2 (en) | Method and system for providing textual content along with voice messages | |
CN104078044B (zh) | 移动终端及其录音搜索的方法和装置 | |
US7143037B1 (en) | Spelling words using an arbitrary phonetic alphabet | |
US5983187A (en) | Speech data storage organizing system using form field indicators | |
US10621974B2 (en) | Updating a voice template | |
US20080273672A1 (en) | Automated attendant grammar tuning | |
JPH10507535A (ja) | 音声作動サービス | |
US20060020471A1 (en) | Method and apparatus for robustly locating user barge-ins in voice-activated command systems | |
US20030072463A1 (en) | Sound-activated song selection broadcasting apparatus | |
JP2008015439A (ja) | 音声認識システム | |
US7881932B2 (en) | VoiceXML language extension for natively supporting voice enrolled grammars | |
US6658386B2 (en) | Dynamically adjusting speech menu presentation style | |
US11582174B1 (en) | Messaging content data storage | |
EP1058445A2 (en) | Voice message filtering for classification of voice messages according to caller | |
JPH10173769A (ja) | 音声メッセージ検索装置 | |
US7386452B1 (en) | Automated detection of spoken numbers in voice messages | |
US7221743B2 (en) | Resetting sent information | |
JP2001007929A (ja) | 音声メールメッセージの取り出し方法 | |
JPH1125112A (ja) | 対話音声処理方法及び装置、記録媒体 | |
US6947969B2 (en) | System and method for accessing voice messaging system data |