JP2001024781A - 発呼者により生成された音声メッセージを分類する方法 - Google Patents
発呼者により生成された音声メッセージを分類する方法Info
- Publication number
- JP2001024781A JP2001024781A JP2000166996A JP2000166996A JP2001024781A JP 2001024781 A JP2001024781 A JP 2001024781A JP 2000166996 A JP2000166996 A JP 2000166996A JP 2000166996 A JP2000166996 A JP 2000166996A JP 2001024781 A JP2001024781 A JP 2001024781A
- Authority
- JP
- Japan
- Prior art keywords
- caller
- message
- user
- voice
- registered
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 230000001755 vocal effect Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 241000286209 Phasianidae Species 0.000 description 1
- 244000028344 Primula vulgaris Species 0.000 description 1
- 235000016311 Primula vulgaris Nutrition 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012913 prioritisation Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/53—Centralised arrangements for recording incoming messages, i.e. mailbox systems
- H04M3/533—Voice mail systems
- H04M3/53333—Message receiving aspects
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/40—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2203/00—Aspects of automatic or semi-automatic exchanges
- H04M2203/30—Aspects of automatic or semi-automatic exchanges related to audio recordings in general
- H04M2203/301—Management of recordings
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/53—Centralised arrangements for recording incoming messages, i.e. mailbox systems
- H04M3/533—Voice mail systems
- H04M3/53333—Message receiving aspects
- H04M3/5335—Message type or catagory, e.g. priority, indication
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Signal Processing (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
Abstract
(57)【要約】
【課題】 大量の音声メッセージを分類し、ある発呼者
からのメッセージを検索する処理をスピードアップして
メッセージに優先度を付す方法を提供すること。 【解決手段】 音声メッセージを受領するステップと、
音声メッセージを生成した発呼者を決定するために音声
メッセージを解析するステップと、発呼者に従って音声
メッセージを分類するステップと、発呼者を登録するス
テップと、発呼者に対する識別を決定するステップと、
発呼者に対する音声特徴を登録するステップと、発呼者
に対する優先レベルを決定するステップを含むことを特
徴とする
からのメッセージを検索する処理をスピードアップして
メッセージに優先度を付す方法を提供すること。 【解決手段】 音声メッセージを受領するステップと、
音声メッセージを生成した発呼者を決定するために音声
メッセージを解析するステップと、発呼者に従って音声
メッセージを分類するステップと、発呼者を登録するス
テップと、発呼者に対する識別を決定するステップと、
発呼者に対する音声特徴を登録するステップと、発呼者
に対する優先レベルを決定するステップを含むことを特
徴とする
Description
【0001】
【発明の属する技術分野】本発明は、音声メッセージシ
ステムに関し、特に発呼者を特定しその音声メッセージ
を分類する発呼者を認証する方法及び発呼者を特定する
方法に関する。
ステムに関し、特に発呼者を特定しその音声メッセージ
を分類する発呼者を認証する方法及び発呼者を特定する
方法に関する。
【0002】
【従来の技術】ボイスメールのような音声メッセージシ
ステムにおいては、受信者(被呼者)はメッセージが生
成された順番にメッセージが与えられる。特定の発呼者
からのメッセージのみに興味を有する被呼者は、その興
味のあるメッセージにたどり着く前に複数の比較的長い
音声メッセージを聞かなければならなかった。しかもま
た、このメッセージはそれらが受信した順番で通常ユー
ザーに与えられ、ユーザーにとって重要であるという観
点からメッセージを優先付けることも行われていなかっ
た。
ステムにおいては、受信者(被呼者)はメッセージが生
成された順番にメッセージが与えられる。特定の発呼者
からのメッセージのみに興味を有する被呼者は、その興
味のあるメッセージにたどり着く前に複数の比較的長い
音声メッセージを聞かなければならなかった。しかもま
た、このメッセージはそれらが受信した順番で通常ユー
ザーに与えられ、ユーザーにとって重要であるという観
点からメッセージを優先付けることも行われていなかっ
た。
【0003】
【発明が解決しようとする課題】本発明の目的は、メッ
セージを生成した発呼者に従って音声メッセージを分類
分けし、そして音声メッセージに対し発呼者を特定する
方法と、システムを提供することである。さらにまた、
本発明の目的は各メッセージに対し発呼者に従って優先
レベルを付与することである。さらに本発明は、大量の
音声メッセージを分類し、ある発呼者からのメッセージ
を検索する処理をスピードアップしてメッセージに優先
度を付す方法を提供する。
セージを生成した発呼者に従って音声メッセージを分類
分けし、そして音声メッセージに対し発呼者を特定する
方法と、システムを提供することである。さらにまた、
本発明の目的は各メッセージに対し発呼者に従って優先
レベルを付与することである。さらに本発明は、大量の
音声メッセージを分類し、ある発呼者からのメッセージ
を検索する処理をスピードアップしてメッセージに優先
度を付す方法を提供する。
【0004】
【課題を解決するための手段】本発明の一実施例におい
ては、メッセージのユーザー(メッセージの受領者)
は、ユーザーが望むメッセージの発呼者を分類して登録
する。メッセージを受領すると本発明のシステムは、こ
のメッセージが登録された発呼者か、または被登録発呼
者からのものか否かを決定する。その後本発明のシステ
ムは、発呼者に従ってメッセージを分類する。発呼者に
よるメッセージの分類を用いて発呼者からのメッセージ
を選択的に取り出し、これによりユーザーは、全てのメ
ッセージを順番に聞くことなくユーザーの興味を持った
メッセージのみを取り出すことができる。例えば、ユー
ザーに発呼者「Tom」からのメッセージをユーザーに
与えるためには、本発明の一実施例においては「To
m」からのメッセージを検出するような発呼者の認証、
及び/又は発呼者の識別を用いている。
ては、メッセージのユーザー(メッセージの受領者)
は、ユーザーが望むメッセージの発呼者を分類して登録
する。メッセージを受領すると本発明のシステムは、こ
のメッセージが登録された発呼者か、または被登録発呼
者からのものか否かを決定する。その後本発明のシステ
ムは、発呼者に従ってメッセージを分類する。発呼者に
よるメッセージの分類を用いて発呼者からのメッセージ
を選択的に取り出し、これによりユーザーは、全てのメ
ッセージを順番に聞くことなくユーザーの興味を持った
メッセージのみを取り出すことができる。例えば、ユー
ザーに発呼者「Tom」からのメッセージをユーザーに
与えるためには、本発明の一実施例においては「To
m」からのメッセージを検出するような発呼者の認証、
及び/又は発呼者の識別を用いている。
【0005】登録されてない発呼者からメッセージを受
領するとユーザーは、その発呼者を登録することを選択
し、それによりその発呼者からのメッセージは、その発
呼者からのものであると分類することができる。
領するとユーザーは、その発呼者を登録することを選択
し、それによりその発呼者からのメッセージは、その発
呼者からのものであると分類することができる。
【0006】
【発明の実施の形態】本発明の一実施例においては、発
呼者のクラス分けとメッセージのフィルタリング処理
(メッセージの取り出し)は、以下の手順でもって行わ
れる。 1. ユーザー(例;被呼者、メッセージの受領者)
は、ユーザーがスポットをあてたい音声メッセージを有
する発呼者を登録する。この登録手続きの間、発呼者の
スピーチの特徴を登録する。ユーザーは、各発呼者に対
する呼びの優先レベル、及び/又は分類を特定する。 2. メッセージを受領すると、発呼者は登録されてい
る場合には、スピーカーの発呼者の識別、及び/又は認
証を登録された発呼者スピーチ特徴を用いて行うことに
より決定される。発呼者の識別は、登録された発呼者か
らの各メッセージに対し登録されている。 3. ユーザーが特定の発呼者のメッセージを要求した
ときには、その発呼者からのメッセージを発呼者識別技
術を用いて取り出される。ユーザーはまたある呼びの優
先レベル(又は優先レベルの範囲)を用いてメッセージ
も要求できる。ある優先レベルを有する呼びのクラスの
全てからのメッセージがその後取り出される。
呼者のクラス分けとメッセージのフィルタリング処理
(メッセージの取り出し)は、以下の手順でもって行わ
れる。 1. ユーザー(例;被呼者、メッセージの受領者)
は、ユーザーがスポットをあてたい音声メッセージを有
する発呼者を登録する。この登録手続きの間、発呼者の
スピーチの特徴を登録する。ユーザーは、各発呼者に対
する呼びの優先レベル、及び/又は分類を特定する。 2. メッセージを受領すると、発呼者は登録されてい
る場合には、スピーカーの発呼者の識別、及び/又は認
証を登録された発呼者スピーチ特徴を用いて行うことに
より決定される。発呼者の識別は、登録された発呼者か
らの各メッセージに対し登録されている。 3. ユーザーが特定の発呼者のメッセージを要求した
ときには、その発呼者からのメッセージを発呼者識別技
術を用いて取り出される。ユーザーはまたある呼びの優
先レベル(又は優先レベルの範囲)を用いてメッセージ
も要求できる。ある優先レベルを有する呼びのクラスの
全てからのメッセージがその後取り出される。
【0007】本発明の登録手順を図1、2に示す。図1
に示すようにユーザーは、11でメッセージを再生する
ことにより、発呼者からのメッセージ10を聞く。ユー
ザーが望む場合には、ユーザーは、たとえば★★S(セ
ーブ)のようなキーの所定のシーケンスを押すことによ
り、発呼者を登録する。その後発呼者の特徴が12で例
えばベクトル(vector quantizatio;VQ)あるいは、
音響セグメントモデル化(acoustic segment modeling;
ASM)により受理で決定され、そして隠れマルコフモ
デル(Hidden Markov Models;HMM)でもってコード
表あるいは、音響セグメントモデルとして13で記憶さ
れる。これに関しては、K.C.Pan et al.,”An efficien
t vector-quantization preprcessor for speaker inde
pendentisolated word recognition ,"Proc. 874-877,M
ar. 1985;U.S.Patent No. 4,783,804; L.R. Rabiner, "
A Tutorial on Hidden Markov Models and Selected Ap
plications in Speach Recognition," Proc. IEEE, Vo
l. 77,No. pp. 257-286, Feb. 1989を参照のこと。
に示すようにユーザーは、11でメッセージを再生する
ことにより、発呼者からのメッセージ10を聞く。ユー
ザーが望む場合には、ユーザーは、たとえば★★S(セ
ーブ)のようなキーの所定のシーケンスを押すことによ
り、発呼者を登録する。その後発呼者の特徴が12で例
えばベクトル(vector quantizatio;VQ)あるいは、
音響セグメントモデル化(acoustic segment modeling;
ASM)により受理で決定され、そして隠れマルコフモ
デル(Hidden Markov Models;HMM)でもってコード
表あるいは、音響セグメントモデルとして13で記憶さ
れる。これに関しては、K.C.Pan et al.,”An efficien
t vector-quantization preprcessor for speaker inde
pendentisolated word recognition ,"Proc. 874-877,M
ar. 1985;U.S.Patent No. 4,783,804; L.R. Rabiner, "
A Tutorial on Hidden Markov Models and Selected Ap
plications in Speach Recognition," Proc. IEEE, Vo
l. 77,No. pp. 257-286, Feb. 1989を参照のこと。
【0008】発呼者の特徴が登録される(図1)と、ユ
ーザーはその発呼者に対し発呼者IDを入力するようプ
ロンプトされる。ユーザーが音声によりあるいはキーボ
ードからのテキストにより、あるいは電話機のダイヤル
パッド上の番号(例えば#5)を用いるかして発呼者I
Dを入力する。このユーザーにより入力された発呼者I
Dは、所定のキーシーケンス(例えば★★R)をユーザ
ーが押すことにより登録される。
ーザーはその発呼者に対し発呼者IDを入力するようプ
ロンプトされる。ユーザーが音声によりあるいはキーボ
ードからのテキストにより、あるいは電話機のダイヤル
パッド上の番号(例えば#5)を用いるかして発呼者I
Dを入力する。このユーザーにより入力された発呼者I
Dは、所定のキーシーケンス(例えば★★R)をユーザ
ーが押すことにより登録される。
【0009】ユーザーが話すことにより発呼者IDを指
定した場合には、発呼者IDの発音が14で、発呼者か
ら発呼者とは無関係の音声認識により得られ、そして登
録される。例えば音声認識機能は、米国特許第4,71
3,777号,4,718,088号,5,509,1
04号,5,579,436号,5,649,057号
により記載された方法とシステムで実現できる。発呼者
IDがテキストで入力された場合には、テキスト−スピ
ーチフロントエンド15を用いて発音を決定できる。こ
のようなテキスト−スピーチフロントエンドは、Mul
tilingual Text−to−speech
Synthesis: The Bell Labs
Approach by R.W.Sproat,Kl
uwerAcademic Publishers,1
998に記載されている。
定した場合には、発呼者IDの発音が14で、発呼者か
ら発呼者とは無関係の音声認識により得られ、そして登
録される。例えば音声認識機能は、米国特許第4,71
3,777号,4,718,088号,5,509,1
04号,5,579,436号,5,649,057号
により記載された方法とシステムで実現できる。発呼者
IDがテキストで入力された場合には、テキスト−スピ
ーチフロントエンド15を用いて発音を決定できる。こ
のようなテキスト−スピーチフロントエンドは、Mul
tilingual Text−to−speech
Synthesis: The Bell Labs
Approach by R.W.Sproat,Kl
uwerAcademic Publishers,1
998に記載されている。
【0010】16で発呼者IDが登録される。発呼者I
Dがダイヤルパッド上の番号で入力された場合、あるい
はキーパッド上のテキストとして入力された場合には、
入力された番号又はテキストがIDとして登録される。
IDが音声として入力された場合には、IDの発音が登
録される。IDがテキストとして入力された場合には、
テキスト及び/又はテキストの発音が登録される。この
場合発呼者IDの発音を登録することにとり、ユーザー
は後で発呼者IDを喋ることにより、その発呼者からの
メッセージを取り出すことができる。別の構成例として
は、発呼者IDをテキストとして登録することにより、
その発呼者からのメッセージは発呼者IDをテキストと
して入力することにより、後で取り出すことができる。
Dがダイヤルパッド上の番号で入力された場合、あるい
はキーパッド上のテキストとして入力された場合には、
入力された番号又はテキストがIDとして登録される。
IDが音声として入力された場合には、IDの発音が登
録される。IDがテキストとして入力された場合には、
テキスト及び/又はテキストの発音が登録される。この
場合発呼者IDの発音を登録することにとり、ユーザー
は後で発呼者IDを喋ることにより、その発呼者からの
メッセージを取り出すことができる。別の構成例として
は、発呼者IDをテキストとして登録することにより、
その発呼者からのメッセージは発呼者IDをテキストと
して入力することにより、後で取り出すことができる。
【0011】本発明の他の実施例においては、図1、2
の発呼者登録手順をより単純化できる。この実施例にお
いては、発呼者のメッセージを再生した後★★Sを押す
ことにより、ユーザーはその発呼者に対するID番号を
特定することができる。言いかえるとユーザーは、自分
の電話機のダイヤルパッド上で★★Sn(nは発呼者の
ID番号である)を押す。
の発呼者登録手順をより単純化できる。この実施例にお
いては、発呼者のメッセージを再生した後★★Sを押す
ことにより、ユーザーはその発呼者に対するID番号を
特定することができる。言いかえるとユーザーは、自分
の電話機のダイヤルパッド上で★★Sn(nは発呼者の
ID番号である)を押す。
【0012】必要によっては、ユーザーは所定のキーシ
ーケンス(例;優先レベルが3の場合には#3★★I)
を押すことにより、または優先レベルをテキストとして
入力することにより、または優先レベルを喋ることによ
り入力して、各発呼者に対し呼びの優先レベルを割り当
てることができる。ユーザーにより優先レベルが割り当
てられていない発呼者からのメッセージは、デフォルト
の優先レベル(低い優先レベル)に割り当てられる。
ーケンス(例;優先レベルが3の場合には#3★★I)
を押すことにより、または優先レベルをテキストとして
入力することにより、または優先レベルを喋ることによ
り入力して、各発呼者に対し呼びの優先レベルを割り当
てることができる。ユーザーにより優先レベルが割り当
てられていない発呼者からのメッセージは、デフォルト
の優先レベル(低い優先レベル)に割り当てられる。
【0013】発呼者の登録手順は、所定のキーシーケン
ス(例えば##)をユーザーが押すことにより終了す
る。
ス(例えば##)をユーザーが押すことにより終了す
る。
【0014】上記した記述により理解できるように様々
な登録手順が本発明では可能であり、その好ましい手順
としては、ユーザーに利用可能なハードウエア(キーパ
ッド対ダイヤルパッド)に一部依存し、あるいはユーザ
ーの好み(音声対ダイヤルパッド)に依存する。
な登録手順が本発明では可能であり、その好ましい手順
としては、ユーザーに利用可能なハードウエア(キーパ
ッド対ダイヤルパッド)に一部依存し、あるいはユーザ
ーの好み(音声対ダイヤルパッド)に依存する。
【0015】発呼者が登録されると来入したメッセージ
は、図3、4の手順に従って処理される。図4に示すよ
うに受信した各メッセージは、登録された発呼者の音声
特徴と22で比較される。発呼者の識別が21で行わ
れ、あるいは発呼者の認証がメッセージの発呼者を特定
するための登録された音声特徴の全てを用いて順番に行
われる。発呼者の識別方法は、米国特許第4,363,
102号に記載されている。発呼者の認証方法は、米国
特許第5,675,704号に記載されている。メッセ
ージの発呼者が識別されると、メッセージは23で発呼
者IDのタグが付される。このメッセージはそれにより
発呼者により区別される。発呼者が識別されていないメ
ッセージは、デホルトのクラス(例えばその他)に属す
るようクラス分けされる。
は、図3、4の手順に従って処理される。図4に示すよ
うに受信した各メッセージは、登録された発呼者の音声
特徴と22で比較される。発呼者の識別が21で行わ
れ、あるいは発呼者の認証がメッセージの発呼者を特定
するための登録された音声特徴の全てを用いて順番に行
われる。発呼者の識別方法は、米国特許第4,363,
102号に記載されている。発呼者の認証方法は、米国
特許第5,675,704号に記載されている。メッセ
ージの発呼者が識別されると、メッセージは23で発呼
者IDのタグが付される。このメッセージはそれにより
発呼者により区別される。発呼者が識別されていないメ
ッセージは、デホルトのクラス(例えばその他)に属す
るようクラス分けされる。
【0016】本発明の一実施例によれば、ユーザーは、
発呼者からのメッセージを用いずに、したがって発呼者
の音声特徴を用いずに発呼者を仮に登録することができ
る。この機能は、メッセージを残していない発呼者から
メッセージをユーザーが期待している場合に有効であ
る。この場合ユーザーは、発呼者の名前(あるいはその
発音)をテキストとして入力する(図2)。その後、こ
の発呼者からのメッセージを図4の手順に従って処理す
る。
発呼者からのメッセージを用いずに、したがって発呼者
の音声特徴を用いずに発呼者を仮に登録することができ
る。この機能は、メッセージを残していない発呼者から
メッセージをユーザーが期待している場合に有効であ
る。この場合ユーザーは、発呼者の名前(あるいはその
発音)をテキストとして入力する(図2)。その後、こ
の発呼者からのメッセージを図4の手順に従って処理す
る。
【0017】図4に示すようにキーセグメントの検出
は、発呼者の名前(あるいは他の発呼者を識別する情
報)例えば「私の名前は○○です。」あるいは「こちら
は○○です。」というような発呼者の名前を与えるよう
なセグメントを検索するために、メッセージに対し25
で実行される。21におけるキーセグメントの検出は、
米国特許第5,509,104号に記載された従来のワ
ードスポッティング、あるいはフレーズ検出技術を用い
る公知の方法で実現できる。キーセグメントの検出は2
6で、発声認証の後に行われる。これは、スピーカーと
は無関係のサブワードの隠れマルコフモデル(Hidden M
arkov Models;HMM)とキーセグメントの発音を用い
て行われる。発声認証は米国特許第5,675,706
号に記載された方法により行われる。
は、発呼者の名前(あるいは他の発呼者を識別する情
報)例えば「私の名前は○○です。」あるいは「こちら
は○○です。」というような発呼者の名前を与えるよう
なセグメントを検索するために、メッセージに対し25
で実行される。21におけるキーセグメントの検出は、
米国特許第5,509,104号に記載された従来のワ
ードスポッティング、あるいはフレーズ検出技術を用い
る公知の方法で実現できる。キーセグメントの検出は2
6で、発声認証の後に行われる。これは、スピーカーと
は無関係のサブワードの隠れマルコフモデル(Hidden M
arkov Models;HMM)とキーセグメントの発音を用い
て行われる。発声認証は米国特許第5,675,706
号に記載された方法により行われる。
【0018】発呼者の名前(あるいは他の識別情報)が
メッセージから取り出されると、その後このメッセージ
は27でその発呼者からのメッセージとして分類され
る。例えば「私の名前はTomです。」、あるいは「こ
ちらはTomです。」とようなフレーズが、あらかじめ
登録された発呼者Tomからのメッセージ内に検出され
(25で)認証される(26で)と、このメッセージは
27で、発呼者Tomからのメッセージとして分類され
る。さらに、音声特徴がそのメッセージから取り出され
て、その発呼者に対し登録される。これにより発呼者は
登録される。ユーザーは新たな発呼者に対し、優先度を
否定するよう促される。
メッセージから取り出されると、その後このメッセージ
は27でその発呼者からのメッセージとして分類され
る。例えば「私の名前はTomです。」、あるいは「こ
ちらはTomです。」とようなフレーズが、あらかじめ
登録された発呼者Tomからのメッセージ内に検出され
(25で)認証される(26で)と、このメッセージは
27で、発呼者Tomからのメッセージとして分類され
る。さらに、音声特徴がそのメッセージから取り出され
て、その発呼者に対し登録される。これにより発呼者は
登録される。ユーザーは新たな発呼者に対し、優先度を
否定するよう促される。
【0019】さらに、本発明の別の実施例によれば、自
分の名前あるいは他の識別情報を示した初めての発呼者
は、仮に登録することなく自動的に登録することもでき
る。この場合、図4の手順によればキーセグメントにス
ポットをあてることは、「私の名前は、○○です。」、
あるいは「こちらは、○○です。」というようなフレー
ズを検出することにより実行される。このようなフレー
ズの後に続く名前を、その発呼者の発呼者IDとして用
いる。この発呼者の音声特徴がメッセージから取り出さ
れ、この発呼者を上記したように登録する。さらに、こ
のメッセージを登録し、その発呼者であるとして分類す
る。後で、例えばメッセージを取り出す時点でユーザー
は、新たに登録した発呼者に対する優先レベルを否定す
るよう促される。
分の名前あるいは他の識別情報を示した初めての発呼者
は、仮に登録することなく自動的に登録することもでき
る。この場合、図4の手順によればキーセグメントにス
ポットをあてることは、「私の名前は、○○です。」、
あるいは「こちらは、○○です。」というようなフレー
ズを検出することにより実行される。このようなフレー
ズの後に続く名前を、その発呼者の発呼者IDとして用
いる。この発呼者の音声特徴がメッセージから取り出さ
れ、この発呼者を上記したように登録する。さらに、こ
のメッセージを登録し、その発呼者であるとして分類す
る。後で、例えばメッセージを取り出す時点でユーザー
は、新たに登録した発呼者に対する優先レベルを否定す
るよう促される。
【0020】発呼者毎の分類メッセージを取り出す本発
明の手順を図5に示す。この取り出し手順は、ユーザー
が発呼者IDをしゃべることにより、あるいは発呼者I
Dをタイプすることにより、あるいは発呼者IDを表す
ダイヤルパッドのキーの所定のシーケンス(例えば発呼
者がクラス5の場合には、#5★★M)を押すことによ
り、特定の発呼者からのメッセージを要求すると、この
取り出し手順は開始する。31でユーザーが発呼者ID
を喋ることにより与えると、音声認識が32で実行さ
れ、検索が登録された発呼者IDで実行されて、要求さ
れた発呼者IDを決定する。
明の手順を図5に示す。この取り出し手順は、ユーザー
が発呼者IDをしゃべることにより、あるいは発呼者I
Dをタイプすることにより、あるいは発呼者IDを表す
ダイヤルパッドのキーの所定のシーケンス(例えば発呼
者がクラス5の場合には、#5★★M)を押すことによ
り、特定の発呼者からのメッセージを要求すると、この
取り出し手順は開始する。31でユーザーが発呼者ID
を喋ることにより与えると、音声認識が32で実行さ
れ、検索が登録された発呼者IDで実行されて、要求さ
れた発呼者IDを決定する。
【0021】ユーザーにより入力された、あるいは32
で決定された発呼者ID情報を用いて、要求された発呼
者のメッセージが33で取り出されて、ユーザーに対し
順番に再生される。これらのメッセージが再生された
後、システムはユーザーに対しさらなる指示を求めてプ
ロンプトする。例えばユーザーは、システムに対しユー
ザーが要求した他の発呼者からのメッセージを再生する
よう指示すること、あるいは全てのメッセージを再生す
ることを指示することができる。
で決定された発呼者ID情報を用いて、要求された発呼
者のメッセージが33で取り出されて、ユーザーに対し
順番に再生される。これらのメッセージが再生された
後、システムはユーザーに対しさらなる指示を求めてプ
ロンプトする。例えばユーザーは、システムに対しユー
ザーが要求した他の発呼者からのメッセージを再生する
よう指示すること、あるいは全てのメッセージを再生す
ることを指示することができる。
【0022】図5の手順は、ユーザーが優先レベルに従
ってメッセージを取り出すものである。例えば、ユーザ
ーは家族に対しては高い優先レベル(例;1)を割り当
てる。31で割り当てる。31でユーザーは、優先レベ
ル1の発呼者からのメッセージのみを取り出したいこと
を指定する。ユーザーが特定の優先レベルを有するメッ
セージを要求した場合(例えば、N番目の優先レベルの
呼びに対しては、#[N]★★Cを押す)、その優先レ
ベルの発呼者からの全てのメッセージが順番に再生され
る。あるいは、ユーザーが優先レベルを指定しない場合
には、システムはデフォルトで優先順位に基づいてメッ
セージを再生する。この場合、高優先度の発呼者のメッ
セージは、低優先度の発呼者のメッセージよりも先に再
生される。
ってメッセージを取り出すものである。例えば、ユーザ
ーは家族に対しては高い優先レベル(例;1)を割り当
てる。31で割り当てる。31でユーザーは、優先レベ
ル1の発呼者からのメッセージのみを取り出したいこと
を指定する。ユーザーが特定の優先レベルを有するメッ
セージを要求した場合(例えば、N番目の優先レベルの
呼びに対しては、#[N]★★Cを押す)、その優先レ
ベルの発呼者からの全てのメッセージが順番に再生され
る。あるいは、ユーザーが優先レベルを指定しない場合
には、システムはデフォルトで優先順位に基づいてメッ
セージを再生する。この場合、高優先度の発呼者のメッ
セージは、低優先度の発呼者のメッセージよりも先に再
生される。
【0023】本発明によれば、ユーザーの好みに合わせ
てメッセージの表示および順番を決定することができ
る。本発明によれば発呼者によりメッセージをクラス分
けすることができるため、あらゆることが可能となる。
例えば、優先レベルにより発呼者を分類すること以外に
発呼者をユーザーの好み、例えば家族、友人、仕事関係
等に分類分けすることができる。
てメッセージの表示および順番を決定することができ
る。本発明によれば発呼者によりメッセージをクラス分
けすることができるため、あらゆることが可能となる。
例えば、優先レベルにより発呼者を分類すること以外に
発呼者をユーザーの好み、例えば家族、友人、仕事関係
等に分類分けすることができる。
【0024】発呼者の分類及びメッセージの取り出しに
加えて、登録された発呼者のリストもユーザーの要求に
より与えることができる。ユーザーは、所定のキーシー
ケンス(例;★★L)を押すことにより、このようなリ
ストを要求できる。
加えて、登録された発呼者のリストもユーザーの要求に
より与えることができる。ユーザーは、所定のキーシー
ケンス(例;★★L)を押すことにより、このようなリ
ストを要求できる。
【0025】さらにまた、メッセージへの認定されたア
クセスを提供するために、発呼者の認証を用いてメッセ
ージへのアクセスを希望しているユーザーが認証された
ユーザーであることを認証することもできる。
クセスを提供するために、発呼者の認証を用いてメッセ
ージへのアクセスを希望しているユーザーが認証された
ユーザーであることを認証することもできる。
【0026】発呼者のクラス分けは、発呼者の電話番号
を登録することにより、及びユーザーIDを用いて、あ
るいは自動電話番号識別(Automtic Number Identifica
tion;ANI)を用いて電話番号の取り出しにより行う
ことができる。
を登録することにより、及びユーザーIDを用いて、あ
るいは自動電話番号識別(Automtic Number Identifica
tion;ANI)を用いて電話番号の取り出しにより行う
ことができる。
【図1】本発明により発呼者を登録する手順を表す図
【図2】本発明により発呼者のクラスIDを登録する手
順を表す図
順を表す図
【図3】登録された発呼者のスピーチを有する発呼者の
クラス分けを行うために、メッセージを処理する図
クラス分けを行うために、メッセージを処理する図
【図4】登録された発呼者のスピーチがない発呼者のク
ラス分けを行うために、、メッセージを処理する図
ラス分けを行うために、、メッセージを処理する図
【図5】発呼者のクラス分けされたメッセージを取り出
す手順を表す図
す手順を表す図
───────────────────────────────────────────────────── フロントページの続き (71)出願人 596077259 600 Mountain Avenue, Murray Hill, New Je rsey 07974−0636U.S.A. (72)発明者 チン−フイ リー アメリカ合衆国、07920 ニュージャージ ー、バスキング リッジ、フェザント ド ライブ 44 (72)発明者 ラドマ ラメシュ アメリカ合衆国、07974 ニュージャージ ー、ニュー プロビデンス、プリムローズ ドライブ 70
Claims (7)
- 【請求項1】 (A) 音声メッセージを受領するス
テップと、 (B) 音声メッセージを生成した発呼者を決定するた
めに、音声メッセージを解析するステップと、 (C) 発呼者に従って音声メッセージを分類するステ
ップと、を有することを特徴とする発呼者により生成さ
れた音声メッセージを分類する方法。 - 【請求項2】 (D) 発呼者を登録するステップを
有し、前記(D)ステップは、 (D1) 発呼者に対する識別を決定するステップと、 (D2) 発呼者に対する音声特徴を登録するステップ
と、を有することを特徴とする請求項1記載の方法。 - 【請求項3】 前記(D)ステップは、 (D3) 発呼者に対する優先レベルを決定するステッ
プを含むことを特徴とする請求項2記載の方法。 - 【請求項4】 前記メッセージは、発呼者識別を用いて
取り出されることを特徴とする請求項2記載の方法。 - 【請求項5】 前記メッセージは、優先レベルを用いて
取り出されることを特徴とする請求項3記載の方法。 - 【請求項6】 前記(D1)ステップは、メッセージ上
の名前のキーセグメントにスポットをあてることを含む
ことを特徴とする請求項2記載の方法。 - 【請求項7】 前記D1ステップは、名前のキーセグメ
ントに対し発声認証を実行するステップを含むことを特
徴とする請求項6記載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US32514999A | 1999-06-03 | 1999-06-03 | |
US09/325149 | 1999-06-03 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2001024781A true JP2001024781A (ja) | 2001-01-26 |
Family
ID=23266642
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000166996A Pending JP2001024781A (ja) | 1999-06-03 | 2000-06-05 | 発呼者により生成された音声メッセージを分類する方法 |
Country Status (4)
Country | Link |
---|---|
EP (1) | EP1058445A2 (ja) |
JP (1) | JP2001024781A (ja) |
KR (1) | KR20010014991A (ja) |
CA (1) | CA2310177A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003289387A (ja) * | 2002-03-15 | 2003-10-10 | Microsoft Corp | ボイスメッセージ処理システムおよび方法 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2364850B (en) * | 2000-06-02 | 2004-12-29 | Ibm | System and method for automatic voice message processing |
EP1265427A1 (en) * | 2001-06-08 | 2002-12-11 | Celldoc (Pty) Ltd | Voice mail with mailbox partitioning |
US20070124384A1 (en) * | 2005-11-18 | 2007-05-31 | Microsoft Corporation | Voicemail and fax filtering |
WO2010050894A1 (en) * | 2008-10-31 | 2010-05-06 | Globalroam Pte Ltd | System and method for providing a voicemail service |
CN101527644B (zh) * | 2009-04-17 | 2011-07-20 | 腾讯科技(深圳)有限公司 | 一种通知消息的发送方法和装置 |
CN105183773B (zh) * | 2015-08-07 | 2019-06-07 | 小米科技有限责任公司 | 信息显示方法和装置 |
CN113506577A (zh) * | 2021-06-25 | 2021-10-15 | 贵州电网有限责任公司 | 一种基于增量采集电话录音完善声纹库的方法 |
-
2000
- 2000-05-23 EP EP00304343A patent/EP1058445A2/en not_active Withdrawn
- 2000-05-29 CA CA002310177A patent/CA2310177A1/en not_active Abandoned
- 2000-06-02 KR KR1020000030394A patent/KR20010014991A/ko not_active Application Discontinuation
- 2000-06-05 JP JP2000166996A patent/JP2001024781A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003289387A (ja) * | 2002-03-15 | 2003-10-10 | Microsoft Corp | ボイスメッセージ処理システムおよび方法 |
JP4619623B2 (ja) * | 2002-03-15 | 2011-01-26 | マイクロソフト コーポレーション | ボイスメッセージ処理システムおよび方法 |
Also Published As
Publication number | Publication date |
---|---|
KR20010014991A (ko) | 2001-02-26 |
EP1058445A2 (en) | 2000-12-06 |
CA2310177A1 (en) | 2000-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102223017B1 (ko) | 공유된 음성 작동 디바이스상의 호출 핸들링 | |
US11335330B2 (en) | Updating a voice template | |
US5797124A (en) | Voice-controlled voice mail having random-order message retrieval based on played spoken identifier list | |
US6327343B1 (en) | System and methods for automatic call and data transfer processing | |
US6356868B1 (en) | Voiceprint identification system | |
US6219407B1 (en) | Apparatus and method for improved digit recognition and caller identification in telephone mail messaging | |
US10110741B1 (en) | Determining and denying call completion based on detection of robocall or telemarketing call | |
US7813482B2 (en) | Internet telephone voice mail management | |
JP3168033B2 (ja) | 音声テレフォン・ダイヤリング | |
US6507643B1 (en) | Speech recognition system and method for converting voice mail messages to electronic mail messages | |
US6438520B1 (en) | Apparatus, method and system for cross-speaker speech recognition for telecommunication applications | |
US20080273672A1 (en) | Automated attendant grammar tuning | |
JPH06242793A (ja) | 仲間正規化スコアリングを使用する話者検証法 | |
US7415415B2 (en) | Computer generated prompting | |
JP2002032213A (ja) | ボイス・メール・メッセージを転記する方法およびシステム | |
US6246987B1 (en) | System for permitting access to a common resource in response to speaker identification and verification | |
JPH09186770A (ja) | 電話における自動音声認識のための方法 | |
JP2003520983A (ja) | 改良されたテキスト−音声変換 | |
JP2008015439A (ja) | 音声認識システム | |
JP2001024781A (ja) | 発呼者により生成された音声メッセージを分類する方法 | |
US20030233231A1 (en) | Apparatus and method for managing privacy using voice recognition and caller identification | |
JP2005142897A (ja) | 電話受付システム | |
EP1056265A2 (en) | Voice message search system and method | |
JP2002252705A (ja) | 話者id検出方法及び装置 | |
JPH1013546A (ja) | 音声ダイヤルシステム |