JPH09205478A

JPH09205478A - 音声認識データベースにアドレスを登録する方法とシステム

Info

Publication number: JPH09205478A
Application number: JP8242247A
Authority: JP
Inventors: Michele B Gammel; ビー．ガムメルマイクル; Thomas D Fisher; ディー．フィッシャートマス
Original assignee: Texas Instruments Inc
Current assignee: Texas Instruments Inc
Priority date: 1995-09-12
Filing date: 1996-09-12
Publication date: 1997-08-05
Anticipated expiration: 2016-09-12
Also published as: MY119374A; DE69636731T2; KR100442308B1; EP0762709A3; EP0762709B1; DE69636731D1; CA2185262A1; JP2007124686A; CA2185262C; JP4355035B2; EP0762709A2; KR970017175A; MX9604051A

Abstract

(57)【要約】【課題】短縮ダイヤル名を登録する方法とシステムを
提供する。【解決手段】本電話システムのメモリには、話者依存
型音声テンプレートと、関連する電話番号、認識不能な
音声を弁別して取り除くためのペナルティ付加型不要要
素モデルが含まれている。新しい音声テンプレートが要
求されると、短縮ダイヤル名（以下、単に名前）のリス
トがいっぱいか否か判断し、いっぱいでない場合、その
名前が短縮ダイヤルリストにある名前によく似ているか
否か判断する。よく似ている場合その名前の登録を拒否
し、似ていない場合、名前が短すぎるか否か判断し、短
すぎない場合、またはユーザが短い名前を入力したい場
合、システムは、名前を繰り返すようにユーザに依頼
し、一致すればその名前を入力し、一致しない場合は１
回目と２回目の発声を交換して比較し、一致するか否か
調べる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は音声認識に関し、よ
り詳細には、音声認識データベースに音声認識アドレス
を登録することに関する。

【０００２】

【発明が解決しようとする課題】短縮ダイヤルにおいて
は、音声認識データベースに名前のアドレスを登録する
ことが使用されている。短縮ダイヤルとは、たとえば、
ある数の電話番号あるいは一群の電話番号が予め格納さ
れており、ユーザは、呼び出す電話番号の名前を言うこ
とによって、その番号群のアドレスだけを指定しなけれ
ばならない場合のことである。ユーザが電話機に向かっ
て名前でアドレスを言うことにより、短縮ダイヤルが利
用でき、電話番号群の中のその名前に関連する電話番号
がダイヤルアップされるということは極めて望ましい。
したがって、電話システムに話かけると正しい番号がダ
イヤルされるように、短縮ダイヤル名のアドレスを電話
システムに登録する方法とシステムを提供することが望
ましい。

【０００３】

【課題を解決する手段】本発明の一好適実施例によれ
ば、認識できなかった音声に対しては、ペナルティ付加
型不要要素モデル（penalized garbage model)を用意
し、ユーザから登録するための新しい発声（utterance)
を受信し、さらにその新しい発声のテンプレートを生成
することにより、アドレスを名前として音声認識データ
ベースに登録する方法とシステムが提供されている。発
声が繰り返されると、そのテンプレートと比較されて、
新らしい発声のテンプレートをデータベースに入れるべ
きか否か判断する。

【０００４】本発明の別の好適実施例によれば、音声認
識データベースに名前を登録する方法とシステムは、話
者に依存するテンプレート（speaker dependent templa
te：以下、「話者依存型テンプレート」と云う）とペナ
ルティ付加型不要要素モデルとを備えたデータベースを
含んでおり、登録される名前とデータベースの中の名前
を比較して、あまりにもよく似た名前は拒否される。

【０００５】本発明の別の好適実施例によれば、データ
ベースに入れる前に、音声認識データベースに登録され
る名前が短すぎるか否か判断する。

【０００６】

【発明の実施の形態】図１は電話システム１０の簡略化
したブロック図である。電話システム１０には、プロセ
ッサ１２に接続する電話機１１が含まれている。オフフ
ック検出回路１３と認識・記録回路１４は、電話機１１
とプロセッサ１２に接続する。またプロセッサ１２はメ
モリ１５に接続する。動作する場合、電話機１１がオフ
フック条件を示していることを、オフフック検出回路１
３がプロセッサ１２に連絡すると、プロセッサ１２は、
プロセッサ１２の中に格納されていてプロセッサ１２が
実行するプログラムに従って、コマンドを監視すること
が可能になる。プロセッサ１２の中のプログラムは、ユ
ーザがディレクトリ名アドレスと短縮ダイヤルリストの
エントリ名さらにディレクトリ名アドレスに関連する電
話番号を発声させることを可能にする。電話システム１
０は、各ユーザがこの特定のディレクトリ名と短縮ダイ
ヤルリストだけにアクセスできるように、ディレクトリ
名アドレスと、関連するエントリ名との話者依存型テン
プレートと、電話番号を格納している。

【０００７】図２は、音声認識電話システム１０におい
て、多数のユーザが発声した短縮ダイヤルのディレクト
リを発生させる方法の初期の流れ図である。一実施例に
おけるプロセッサ１２は、この流れ図に従ってプログラ
ムが組まれている。電話システム１０のオフフック検出
回路１３は、ステップ１６で電話機１１を監視して特定
の電話機のオフフック条件を検出する。オフフック条件
が検出されると、プロセッサ１２はステップ１７で、ユ
ーザにコマンドの入力を促す。ステップ１８でプロセッ
サ１２は、比較器とメモリ１５とを含むプロセッサを備
えている認識・記録回路１４とともに、電話システム１
０のメモリ１５に符号化されて入っている複数のテンプ
レートの１つとユーザの応答を比較する。電話システム
１０は汎用性を備えているので、ステップ１８で、ユー
ザから発声された語か、場合によっては、これに対応し
てコマンド語を表す電話機１１のＤＴＭＦ押しボタン符
号かのいずれかを受信できるように考慮されている。全
図を通して、アスタリスクは、電話システム１０が、発
声されたコマンド語、またはこれに対応して発声された
コマンド語を表すＤＴＭＦ押しボタン符号のいずれかを
認識できることを示している。またアスタリスクは、電
話システム１０が、モデルとユーザの応答を一致させる
とき、話者に依存しない音声認識を実行することを示し
ている。説明のために限定して、以下に説明する電話シ
ステムは、対応するＤＴＭＦ押しボタン符号による代表
的なコマンドのかわりに、発声された応答を受信する電
話システムであるとして、好適実施例の説明を進めるこ
とにする。

【０００８】電話システム１０は、ステップ１８で各種
コマンドフレーズの１つを認識し、要求されたコマンド
に従って進行することができる。電話システム１０はス
テップ１９で、最初のコマンドとしてユーザから受信し
た電話番号を認識することができる。電話システム１０
はステップ２０で、受信した番号をユーザに報告する
と、シーケンスはステップ２２に続き、要求された呼を
発信するため、ここで電話番号が自動的にダイヤルされ
る。

【０００９】また電話システム１０はステップ２４で、
ユーザから受信した第２のコマンドフレーズとして、
「ヘルプ（help）」などの緊急コマンドを認識する。電
話システム１０はステップ２６で、たとえば、９１１な
どの緊急電話番号がダイヤル中であることをユーザに連
絡すると、シーケンスはステップ２２に進み、ここでも
う一度呼を発信することができる。また電話システム１
０は、ユーザからの第３のコマンドフレーズ、「キャン
セル（CANCEL）」を認識すると、このコマンドは電話シ
ステム１０を自動的にステップ１７に戻し、現在進行中
のすべてのコマンドシーケンスを停止させる。たとえ
ば、図１に示すように、ユーザは、電話回線の他端で接
続が設定される前に電話をかけることを停止することが
できる。図１にはただ１箇所しか示されていないが、ス
テップ２８で「キャンセル」コマンドを認識すること
は、後に続く各種図面を参照して説明されている電話シ
ステムの方法中どこにおいても発生し得るのである。

【００１０】ユーザがユーザディレクトリリストを入力
することを要求すると、電話システム１０は、ステップ
３０で第４のコマンド語を認識する。電話システム１０
がこのコマンドを認識すると、処理はステップ３２に移
り、ユーザはディレクトリオプションを入力することが
可能になる。図３は、電話システムのプログラムのディ
レクトリオプション部分の処理ステップの流れ図を示し
ている。コマンドを認識すると、ユーザはステップ３４
で、ディレクトリオプションを入力する。認可されたユ
ーザだけがディレクトリオプションを入力できることを
保証するため、電話システム１０は、ステップ３６、３
８でセキュリティ対策（security measures)を実行し、
ディレクトリオプションを入力する認可を検証すること
をユーザに要求する。この検証は、ユーザがシステムに
入力する認可符号であってもよいし、あるいはユーザの
発声パターンと電話システム１０に格納された検証テン
プレートを一致させる、話者依存型音声認識テンプレー
トが存在していればよい。

【００１１】電話システム１０は、ステップ３６でユー
ザに適切な検証を促し、ステップ３８でユーザの検証応
答を認識する。電話システム１０は、検証処理の部分と
して、ステップ３６、３８を１回以上実行する。電話シ
ステム１０が、ユーザが入力した検証符号を認識しない
場合、「キャンセル」コマンドと同様に、処理の流れは
図２のステップ１７に戻る。電話システム１０が有効な
検証符号を認識すると、処理の流れはステップ４０に続
き、ここで電話システム１０は、ディレクトリオプショ
ンの４つのコマンドの１つを入力するようユーザに促
す。ユーザの検証については、Ｋｅｒｏによる米国特許
第５，３６９，６８５号を参照されたい。

【００１２】ユーザが適切な検証を行い、ディレクトリ
オプションを入力すると、電話システム１０は、ステッ
プ４２で第１のサブコマンド語を認識し、ユーザディレ
クトリ名をシステムに追加する。電話システム１０は、
ディレクトリ名を要求し、そしてステップ４６で、電話
システムに格納されるテンプレートにユーザの応答をセ
ーブすることにより、ステップ４４でユーザを登録す
る。ユーザディレクトリ名を登録するとき、電話システ
ム１０は、その目的でつまりその電話機に対してテンプ
レートを生成し、既に登録されているユーザ識別テンプ
レートの既存リストに、生成したテンプレートをセーブ
するため、ステップ４４、４６を繰り返し実行する。テ
ンプレートがセーブされると、処理の流れはステップ４
０に戻り、ここで電話システム１０は、ユーザに別のコ
マンド語を入力することを促す。

【００１３】電話システム１０は、ステップ４８で第２
のサブコマンド語を認識し、ユーザディレクトリ名を削
除する。サブコマンド語が認識されると、電話システム
１０はステップ５０で、削除するユーザディレクトリの
名前を入力するようユーザに促す。電話システム１０が
ステップ５２でユーザが入力したディレクトリ名を認識
すると、ステップ５４でディレクトリ名が削除されたこ
とを確認するようユーザに要求する。ユーザがディレク
トリ名の削除を確認しないと、処理の流れはステップ４
０に戻り、ここで電話システム１０はユーザにコマンド
フレーズを入力することを促す。ステップ５４でユーザ
がディレクトリ名の削除を確認すると、電話システム１
０はステップ５６で、そのディレクトリ名に対して生成
されたテンプレートと、そのディレクトリ名に対応する
すべての電話機リストのエントリとを削除する。これら
のエントリが削除されると、処理の流れはステップ４０
に戻り、ここで電話システム１０はユーザに新しいコマ
ンドフレーズを入力することを促す。

【００１４】電話システム１０は、ステップ５８で第３
のサブコマンドフレーズを認識し、ディレクトリ名のリ
ストの見直し（review）を行うことができる。第３のサ
ブコマンドフレーズが認識されると、電話システム１０
は、ステップ４０に戻って新しいコマンドフレーズを要
求する前に、ステップ６０でユーザディレクトリリスト
を再生する。また電話システム１０は、ステップ６２
で、第４のコマンドフレーズを認識し、ユーザがディレ
クトリオプションの要求を完了したことを判断する。第
４のコマンドが認識されると、処理の流れは図２のステ
ップ１７に戻り、ここで電話システム１０は、ユーザに
電話番号を入力するように促す。

【００１５】図２に戻ると、電話システム１０は、ステ
ップ６４で第５のコマンドフレーズとしてディレクトリ
名を認識する。電話システム１０がユーザのディレクト
リ名を認識すると、処理の流れはステップ６６に進み、
ここで電話システムは短縮ダイヤルリストオプションに
入る。図４は、本発明の短縮ダイヤルリストオプション
の処理の流れ図である。電話システム１０は、ステップ
６８で短縮ダイヤルリストオプションに入り、それに続
いてステップ７０で、ユーザに、呼び出す名前を要求す
るかあるいはリストに入れるかのいずれかを促す。電話
システム１０がステップ７２でエントリ名を認識する
と、ステップ７４でユーザにプロンプトが与えられ、要
求された名前を電話システム１０が呼び出すことを示
す。電話システム１０は、前に説明したように、図２の
ステップ２２で呼を発信する。また電話システム１０
は、ステップ７６でリストコマンドを認識しかつ入力で
きるとともに、ステップ７８でユーザに５つのリストコ
マンドフレーズの１つを入力するように促すことができ
る。

【００１６】電話システム１０はステップ８０で、ユー
ザのディレクトリ名の下に、エントリ名と電話番号とを
短縮ダイヤルリストに追加する第１のリストコマンドフ
レーズを認識する。このコマンドフレーズが認識される
と、電話システム１０は、ステップ８２で短縮ダイヤル
リストにこのエントリ名を登録するようユーザに促す。
電話システム１０は、ステップ８３で、いまステップ８
２で登録したエントリ名に対応する電話番号を登録する
ようユーザに促す。電話システム１０はステップ８４
で、ユーザが登録した名前と電話番号とに対応するテン
プレートを生成しセーブする。短縮ダイヤルリストに使
用するエントリ名と電話番号の有効なテンプレートを検
証しかつ生成するため、電話システム１０はステップ８
２、８３、８４を繰り返し実行する。テンプレートがセ
ーブされると、処理の流れは、ステップ７０の短縮ダイ
ヤルリストオプションルーチンの先頭に戻る。

【００１７】電話システム１０はステップ８６で、エン
トリ名に対応する電話番号を修正する第２のリストコマ
ンドを認識する。このコマンドが認識されると、電話シ
ステム１０はステップ８８で、電話番号を修正する名前
を用意するようにユーザに促す。ステップ９０でユーザ
が入力した名前を電話システム１０が認識すると、ステ
ップ９２で、ユーザはその名前に対応する電話番号を修
正することが可能になる。電話システム１０はステップ
９４でそれを使って、修正が要求されたエントリ名に対
応する、修正された番号のテンプレートをセーブする。
有効な電話番号テンプレートが生成されることを保証す
るため、電話システム１０はステップ９２、９４を繰り
返し実行する。テンプレートがセーブされると、前に説
明したように、処理の流れはステップ７０に戻る。

【００１８】電話システム１０はステップ９６で、短縮
ダイヤルリストから名前を削除する第３のリストコマン
ドを認識する。このコマンドが認識されると、電話シス
テム１０はステップ９８で、短縮ダイヤルリストから削
除する名前を入力するようユーザに促す。電話システム
１０がステップ１００でその名前を認識すると、ステッ
プ１０２でその名前が削除されたことを確認するように
ユーザに要求する。ユーザがその名前を削除したくない
場合は、処理の流れはステップ７０に戻る。ユーザがそ
のエントリ名の削除を確認すると、電話システムは、処
理の流れをステップ７０に戻す前に、エントリ名テンプ
レートと、対応する電話番号テンプレートとをステップ
１０４で削除する。

【００１９】電話システム１０はステップ１０６で、ユ
ーザが自己の短縮ダイヤルリストを見直すことを可能に
する第４のリストコマンドフレーズを認識する。このコ
マンドフレーズが認識されると、電話システム１０はス
テップ１０８で、ユーザの短縮ダイヤルリストを再生
し、処理の流れをステップ７０に戻す。また電話システ
ム１０はステップ１１０で、ユーザが短縮ダイヤルリス
トオプションを完了したことを示す第５のリストコマン
ドフレーズを認識する。このコマンドフレーズが認識さ
れると、前に説明したように、処理の流れは図２のステ
ップ１７に戻り、この方法が繰り返し実行される。

【００２０】要約すると、電話システムは、この電話シ
ステムの認可されたユーザ毎に別々のディレクトリを発
生させることができる。各ユーザはユーザ固有のディレ
クトリの下に名前と電話番号とを含む短縮ダイヤルリス
トを生成することができる。話者によって決まる特徴を
利用することにより、認可されたユーザのディレクトリ
つまり短縮ダイヤルリストには、誰もアクセスすること
はできない。上に述べたことは、音声認識を使用して短
縮ダイヤル名を登録することが背景になっている。

【００２１】本発明の一実施例によれば、図１のプロセ
ッサ１２は、図５の流れ図に従って短縮ダイヤルリスト
に短縮ダイヤル名を登録する動作がプログラムで組み込
まれている。プロセッサ１２には、ＥＬＰＣカウンタと
ＵＬＰＣカウンタとが含まれているので、プロセッサ１
２は、加入者が基本フレーズを生成した後、それらを修
正することを可能にする。加入者は、音声による名前を
言って、発声した名前を最も良く認識できるような方法
で、その名前をリストに入れる機会を３回許されてい
る。またこのシステムは、加入者が、既にリストに存在
している名前をリストに追加したり、あるいは非常に良
く似た名前をリストに追加したりすることのいずれかに
関する課題に対処している。またこのシステムは、名前
が登録され更新されるとき、加入者が非常に違う言い方
で名前を言うことに関する課題にも対処している。

【００２２】語彙外音声（out-of-vocabulary speech）
であることを判断する不要要素モデル（garbage model)
を使用した最近の進展により新しい認識処理が生まれた
が、この新しい認識処理は語彙内音声（in-vocabulary
speech）の認識を高率に保つと同時に語彙外音声の認識
能力を備えている。この新しい認識処理は、発声された
短縮ダイヤル名と並行して語彙外音声を弁別するペナル
ティ付加型不要要素モデルを利用している。この方法
は、音声による短縮ダイヤルの登録の認識に適用され、
既に短縮ダイヤルリストに存在する名前を登録するとい
う課題と、登録中に変わりすぎる（too much variabili
ty）という課題とに対処できる。不要要素モデルは、言
葉という音声、あるいは認識システム内に他のモデルが
存在しない音のモデルとして定義されている。不要要素
モデルをつくる手段にはいくつかの可能性がある。最新
の認知工学に使用される１つの不要要素モデルは、図６
に示すように、音声（speech sounds)の広い音声クラス
（phonetic classes）の集りのモデルをつくり、この音
声クラスが結合されて１つの単語をつくる音を生成す
る。図６に示すように、複数の円は音響的に広い音声ク
ラスを表している。実線は、１つの広い音声クラスから
他の音声クラスの方向のいずれにも遷移が生じ得ること
を示している。点線は、このモデルが特定の状態でルー
プできることを示している。遷移は、時間的な音素配列
論（phonotactic)の制約に基づく確率によって重みづけ
される。これらの制約は以下のようなことを必要とす
る。すなわち、与えられた音声クラスが音声を解釈する
ために使用されることが長時間になるほど、そのクラス
は音声を解釈するために使用されそうになく、そのクラ
スが後に続く音声を解釈するために使用されそうにない
ほど、後続の音声は他の異なる音声クラスによって解釈
されそうであるという制約である。このモデルは、どん
な状態に入っても、またどんな状態から出て行っても音
声の解釈を開始する。

【００２３】よく似た名前をチェックしている間に、リ
ストに追加する新しい名前の認識が実行される。新しい
名前は、リストの既存の名前か、並列不要要素モデル
（parallel garbage model）かのいずれかに一致する。
新しい名前と既存の名前が一致すると、その名前または
よく似た名前が既にリストにあるので、追加することは
できないとユーザに連絡される。新しい名前が並列不要
要素モデルに一致すると、その名前はリストに無いとい
うことを前提にして、名前の追加が継続される。不要要
素モデルのペナルティを調整して、リストにある名前か
不要要素モデルかのいずれかに一致する感度に影響を及
ぼすことが可能である。

【００２４】不要要素モデルは、ＬｏｒｉｎＮｅｔｓ
ｃｈ外により、本願と同時に出願した「話者に依存する
強靭な音声モデルの登録とモデル作成方法ならびに装置
（Enrollment and Modeling Method and Apparatus for
Robust Speaker DependentSpeech Models)」というタ
イトルの特許出願シリアル番号第号で考察され
ている音素配列論的不要要素モデル（phonotactic garb
age model)に似ていることが望ましい。このモデルには
言語上の制約がある。

【００２５】新しい名前を短縮ダイヤルリストに登録し
ようとする加入者は、「音声ダイヤルリスト管理（Voic
e Dial List Management）」あるいは図３の位置４０ま
たは図４の７８に入り、「エントリ追加（ＡｄｄＥｎ
ｔｒｙ）」を入力するかまたは「エントリ追加（Ａｄｄ
Ｅｎｔｒｙ）」と言う。このコマンドが認識される
と、システムはステップ２０１で、リストがいっぱいか
否か先ずチェックする。リストがいっぱいの場合、シス
テムは、リストがいっぱいであることをユーザに連絡す
る。このことは、メモリ１５からの合成された音声コマ
ンドによって実行され、合成器１５ａは「あなたのリス
トはいっぱいです。新しい名前を追加する前にあなたは
名前を削除しなければなりません」と言う。ユーザは
「リスト管理」に戻って、リストにある名前の１つを削
除することができる。これについては図４のステップ９
６からステップ１０４を参照されたい。リストがいっぱ
いの場合またはリスト上の名前を削除した後、「追加エ
ントリのＬＰＣＣＮＴ（ＡｄｄＥｎｔｒｙＬＰＣＣＮ
Ｔ）」に戻ると、ＥＬＰＣカウンタとＵＬＰＣカウンタ
とはゼロにセットされる（ステップ２０２）。つぎにシ
ステムは、登録用ＬＰＣ（ＥｎｒｏｌｌｍｅｎｔＬＰ
Ｃ（Linear Predictive Coding））つまりＥＬＰＣと更
新用線形予測符号化（Update Linear Predictive Codin
g ：ＵＬＰＣ）の回数のカウントを続ける。ＬＰＣは、
線形予測パラメータによって表された音声のサンプルで
ある。ＬＰＣは線形であるということを前提とする。Ｌ
ＰＣの詳細については、たとえば、Ｐｒｅｎｔｉｃｅ
Ｈａｌｌ発行（ＩＳＢＮ０- １３- １６３８４１-
６）、ＦｒａｎｋＦａｌｌｓｉｄｅおよびＷｉｌｌｉ
ａｍＷｏｏｄｓ編「コンピュータによる音声処理（Comp
uter Speech Processing）」中の（第４章）、Ｂｉｓｈ
ｕｎｕＳ．Ｉｔａｌによる「音声の線形予測符号化
（Linear Predictive Coding of Speech）」の８１頁か
ら１２４頁を参照されたい。ここでこれらの出版物に言
及することによりこれらの出版物の内容を本願に明確に
組み入れることにする。ＥＬＰＣとＵＬＰＣの回数が両
方ともゼロの場合は、前から１つも入力されていないこ
とを示しており（ステップ２０３）、指導用の合成され
たプロンプト文が再生される（ステップ２０３の判断が
ｙｅｓ）。合成された文は、「システムはあなたがその
名前をどのように言うのか学習する必要があります。あ
なたが最初にその名前を言ってから長い休止時間があり
ますので、１回乃至４回その名前を繰り返して下さい。
＃をダイヤルすればこのメッセージをスキップすること
ができます。ビープ音の後で、音声呼出しの名前を言っ
てください。」と言うであろう。（ユーザに名前を言う
ようにメッセージの終りでビープ音が鳴る。）ユーザは
名前を言う。ステップ２０５でチェックが行われ、（た
とえば）１５の名前がリストされているリストに既にあ
る名前か、ある名前によく似ているか、あるいは不要要
素モデルに一致するか否か判断する。（よく似た名前が
既にあることを示す）リスト上の名前と一致すると、シ
ステムはステップ２０６の「追加エントリのリトライ
（ＡｄｄＥｎｔｒｙＲｅｔｒｙ）」に入る。リトラ
イの出力が「ｙｅｓ」の場合（ステップ２０７）、シス
テムは音声ダイヤルリスト管理メニューつまり図３の４
０あるいは図４の７８に戻る。リトライの出力が「ｎ
ｏ」の場合（ステップ２０７の「ｎｏ」）、システムは
合成器１５ａを介して、「似すぎています（too simila
r)」メッセージ、（「．．．．はあなたのリストの別の
名前と非常によく似ています。違う名前を選んでくださ
い」）を再生し図５に示すＥＬＰＣカウンタ２０２を増
分して、短いプロンプト（「ビープ音の後で、音声ダイ
ヤルの名前を言ってください」）を使用して再度試行す
る。時間内にユーザが新しい名前を言わない場合、シス
テムはタイムアウトになり、前記カウンタを増分すると
ともに新しい名前を要求する。キーボードの無効キーが
押下されると及び／或いはタイムアウトになると、シス
テムは、ステップ２０２の前記カウンタを増分するとと
もに新しい名前を言うように要求する。３回の試行ある
いは５回の無効ＤＴＭＦキーの後、システムが登録に失
敗すると、システムは切断される（ステップ２０９）。
言われた名前が一致しないと、システムは図７の「追加
エントリの登録（ＡｄｄＥｎｔｒｙＥｎｒｏｌ
ｌ）」に進む。

【００２６】図５の「追加エントリの登録」のところ
で、一致しない名前を言うことに成功すると、システム
は図６の流れ図に従って進む。オンライン登録を開始す
ると、発声が記憶される。セーブされた発声は、オフラ
イン登録を実行することにより、テンプレートを生成す
るのに使用される（ステップ３０１）。発声の長さが短
すぎず、たとえば、データが１０フレームある最小しき
い値長さより長いかまたは等しい場合（ステップ３０２
の「ｎｏ」）、システムは、追加エントリを更新するス
テップ３０５に進み、図８のフローチャートに従って進
む。メッセージが短すぎるか最小しきい値より短い（こ
の例では、１０フレームのデータより短い）場合（ステ
ップ３０２の「ｙｅｓ」）、システムは合成器を介し
て、前に使用されていないテンプレートであっても、ユ
ーザがそのテンプレートを使用したいか否か質問する。
最小しきい値より短いことを示す「ｙｅｓ」の場合、プ
ロンプトメッセージは、「名前（与えられた名前）は、
推奨する名前の長さより短い長さです。名前と苗字の両
方を使用するのが最適です。この名前を使用するために
は、とにかく「オーケー」と言ってください。この名前
を使用することを中止するなら「キャンセル」と言って
ください。」と言う。このメッセージに続いてビープ音
が鳴りプロンプトが出る。応答ステップ３０７で「オー
ケー」を受信すると、システムは図８の追加エントリの
更新に進む。「キャンセル」が受信されると、「名前は
登録されません」のような合成された文が生成され用意
されて、システムは音声ダイヤルリスト管理メニューつ
まり図３の４０あるいは図４の７８に戻る。何も言われ
ないと（タイムアウトになると）、あるいは認識されな
いコマンドつまり正しくないキーが押下されると、シス
テムは合成された命令を用意するとともに応答の探知に
戻る。この動作を５回繰り返した後で認識された応答が
ないと、あるいはタイムアウトが３回発生すると、シス
テムはメッセージとともに切断される（ステップ３０
９）。ＤＴＭＦキーが押下されると、合成器はメッセー
ジ「キーが正しくありません」を用意する。誤ったキー
が押されてタイムアウトが発生する都度、そして３回目
と４回目の認識できない音声コマンドの後で、合成器
は、「「オーケー」か「キャンセル」と言ってくださ
い」、あるいはもっと詳しく指示するためには、「この
名前の追加を続けるには「オーケー」と言ってくださ
い。この名前の追加を中止するなら「キャンセル」と言
ってください。」というメッセージを言う。短い名前で
あっても、「オーケー」が認識されると、システムは図
８の「追加エントリの更新」に進む。

【００２７】認識されたことを判断する場合、システム
は、以下に記すペナルティ付きの不要要素モデルを使用
する。

【表１】

【表２】上に掲げた不要要素モデルのいずれに対しても、受信し
たテンプレートが高い点数になる場合、このテンプレー
トは認識不能な音声に対して高い点数を受けるので、認
識不能な音声として拒否される。

【００２８】図８を参照すると、テンプレートがダウン
ロードされると（ステップ４０１）、システムは、更新
が行われていないかどうか判断する。更新の間、登録テ
ンプレートの中にない音声を解釈するために不要要素モ
デルが使用される。たとえば、登録中に、ユーザが「ア
ー、ＲｏｇｅｒＲａｂｂｉｔ」と言ったとすると、不
要要素モデルは（あえぐような声）「アー」を解釈でき
るので、更新発声の「ＲｏｇｅｒＲａｂｂｉｔ」部分
のみの平均がとられて、新しい名前のテンプレートに入
れられる。更新用カウンタ（ＵＬＰＣ）がゼロの場合は
（ステップ４０２）、更新が完了していないことを示し
ており、システムは合成器を介して、「もう一度名前を
言ってください」とユーザに要求する。更新カウンタが
増分され（ステップ４０３）応答がある場合、その応答
を使用してテンプレートの更新が行われる（ステップ４
０４）。テンプレートがチェックされ、正しく更新が行
われたか否か判断される。正しく更新された場合、その
名前の電話番号を入力するようユーザに要求する（ステ
ップ４０５）。この更新はキー入力してもよいし、話者
に依存しない認識モデルを備えた音声認識を使用して言
葉で言ってもよい。更新に失敗すると、システムは図９
の追加エントリのリトライステップに進む。更新に失敗
すると、登録の発声と更新の発声が交換され、登録と更
新はその順序で行われる。初めての場合、ユーザは発声
する準備ができていないことが多いので、名前を言う前
に「アー」のような声を挟むことが多いが、もう一度言
ってくださいと要求すると、言うための準備ができる。
最初のテンプレートには「アー」という声が入るので、
更新する場合、「アー」の声がないためその更新は失敗
するかもしれない。発声を交換すると、より明瞭な２回
目の発声が登録に使用されるので、最初の発声を使用し
て更新することになる。この場合、発声の始めにある
「アー」という声は不要要素モデルによって解釈され、
「アー」はテンプレートに含まれない。１回目と２回目
の発声を交換することに失敗すると、試行の出力を介し
て３回目の発声が要求される（ステップ４０６）、更新
にはその応答と２回目の発声が使用される。登録に３回
目の発声が要求されると、先ずその名前がチェックされ
てリスト上の別の名前によく似ているか否か判断され
る。よく似ていると、その名前は使用されず、処理は図
５の入力Ａに進む。発声が短すぎたために登録に失敗し
た場合は、システムは加入者に連絡して、別の発声をす
るように促す。登録に成功したが、発声が短すぎる（フ
レームの長さが最小しきい値長さより短い）場合、登録
名が短すぎるため認識できませんでしたという警告が加
入者に与えられる。加入者は、「オーケー」か「キャン
セル」を言うように促される。

【００２９】要約すると、更新に失敗すると発声が交換
され、２回目の発声（必要ならば３回目の発声）が、１
回目の発声より良好な登録の発声になっているかどうか
判断される。登録と更新が次に示す順序で行われると、
ユーザには最も多くても３回の発声を要求するだけであ
る。

【表３】登録更新１２２１２３３２３１１３

【００３０】他の実施例本発明とその利点を詳細に説明してきたが、添付の請求
の範囲に定義されているとおり、本発明の主旨と範囲か
ら逸脱することなく、各種の変更、代替、改良ができる
ことを理解されたい。

【００３１】以上の説明に関して更に以下の項を開示す
る。１．音声認識データベースに音声認識モデルを登録する
方法であって、異質な音声を解釈するペナルティ付加型
不要要素モデルを備え、登録するため音声認識する新し
い発声をユーザから受信し、登録のために受信した前記
発声のテンプレートを生成し、登録される発声を再度繰
り返すことをユーザに要求し、２回目に受信した発声を
受信し、２回目の発声を、生成したテンプレートおよび
ペナルティ付加型不要要素モデルと比較して一致してい
るか否か判断し、語彙内音声に関して一致している場
合、前記新しいテンプレートを短縮ダイヤルリストに追
加する、ことを含むことを特徴とする方法。

【００３２】２．第１項記載の方法であって、前記比較
ステップは、前記２回目の発声を前記ペナルティ付加型
不要要素モデルと比較し、登録されたテンプレートと比
べて、語彙外音声に関して前記ペナルティ付加型不要要
素モデルと所定の範囲内で一致する前記２回目の発声中
の発声のすべてを拒否するステップを含むことを特徴と
する方法。

【００３３】３．第１項記載の方法であって、前記比較
が失敗して一致しない場合、テンプレートと前記２回目
に受信した発声を交換して、前記比較するステップを繰
り返し実行するステップを含むことを特徴とする方法。

【００３４】４．第３項記載の方法であって、前記交換
するステップが比較結果を得るのに失敗した場合、３回
目の発声を要求して受信し、第３の応答と２回目の発声
が比較されそして一致している場合、２回目の発声のテ
ンプレートをデータベースに登録するステップを含むこ
とを特徴とする方法。

【００３５】５．第３項記載の方法であって、後に続く
発声を要求し、交換が前の発声の比較結果を得るのに失
敗した後、前の発声と後に続く応答が比較されそして一
致している場合、後に続く発声のテンプレートをデータ
ベースに入れるステップを含むことを特徴とする方法。

【００３６】６．電話システムに短縮ダイヤル名を登録
する方法であって、異質な音声を解釈するペナルティ付
加型不要要素モデルを備え、登録するための新しい短縮
ダイヤル名の発声をユーザから受信し、登録のために受
信した前記短縮ダイヤル名の発声のテンプレートを生成
し、登録される新しい短縮ダイヤル名の発声を再度繰り
返すことをユーザに要求し、受信した新しい短縮ダイヤ
ル名の２回目の発声を受信し、新しい短縮ダイヤル名の
２回目の発声を、生成したテンプレートおよびペナルテ
ィ付加型不要要素モデルと比較して一致しているか否か
判断し、一致している場合、前記新しい短縮ダイヤル名
のテンプレートを短縮ダイヤルリストに追加する、こと
を含むことを特徴とする方法。

【００３７】７．第６項記載の方法であって、前記新し
い短縮ダイヤル名のテンプレートに関連する電話番号を
要求しかつ追加するステップを含むことを特徴とする方
法。

【００３８】８．第７項記載の方法であって、比較が一
致に失敗した場合、テンプレートと前記受信した短縮ダ
イヤル名の２回目の発声とを交換し、前記比較するステ
ップを繰り返し実行するステップを含むことを特徴とす
る方法。

【００３９】９．第８項記載の方法であって、新しい短
縮ダイヤル名の３回目の発声を要求して受信し、前記交
換するステップが比較結果を得るのに失敗した後第３の
応答と２回目の発声が比較されそして一致している場
合、２回目の発声を短縮ダイヤルリストに入力するステ
ップを含むことを特徴とする方法。

【００４０】10．第８項記載の方法であって、後に続く
新しい短縮ダイヤル名の発声を要求して受信し、交換が
前の発声に関する比較結果を得るのに失敗した後、後に
続く応答と前の発声が比較されそして一致している場
合、後に続く発声のテンプレートをデータベースに入力
するステップを含むことを特徴とする方法。

【００４１】11．第６項記載の方法であって、前記比較
ステップは、前記２回目の発声と前記ペナルティ付加型
不要要素モデルを比較して、所定の範囲内で前記ペナル
ティ付加型不要要素モデルと一致する前記２回目の発声
中の発声をすべて拒否するステップを含むことを特徴と
する方法。

【００４２】12．第１１項記載の方法であって、比較に
失敗して一致しない場合、テンプレートと前記受信した
短縮ダイヤル名の２回目の発声を交換し、前記比較する
ステップを繰り返し実行するステップを含むことを特徴
とする方法。

【００４３】13．第１２項記載の方法であって、新しい
短縮ダイヤル名の３回目の発声を要求して受信し、前記
交換するステップが比較結果を得るのに失敗した後第３
の応答と２回目の発声が比較されそして一致している場
合、２回目の発声を短縮ダイヤルリストに入力するステ
ップを含むことを特徴とする方法。

【００４４】14．第１０項記載の方法であって、後に続
く新しい短縮ダイヤル名の発声を要求して受信し、前記
交換するステップが前の発声に関する比較結果を得るの
に失敗した後、後に続く応答と前の発声が比較されそし
て一致している場合、後に続く発声のテンプレートをデ
ータベースに入力するステップを含むことを特徴とする
方法。

【００４５】15．音声認識データベースにアドレスを登
録する方法であって、名前のアドレスの話者依存型テン
プレートを用意するステップと、異質な音声を解釈する
ペナルティ付加型不要要素モデルを用意するステップ
と、登録されるアドレスが、前に用意された話者依存型
テンプレートか前記ペナルティ付加型不要要素モデルか
のいずれかと一致しているか否か判断し、前に用意され
た話者依存型テンプレートと一致する場合は登録を拒否
するステップと、を含むことを特徴とする方法。

【００４６】16．電話システムに短縮ダイヤル名を登録
する方法であって、短縮ダイヤル名と関連する電話番号
との話者依存型テンプレートを用意し、異質な音声を解
釈するペナルティ付加型不要要素モデルを用意し、登録
される名前が、前に用意された話者依存型テンプレート
か前記ペナルティ付加型不要要素モデルかのいずれかと
一致しているか否か判断し、前に用意された話者依存型
テンプレートと一致する場合は登録を拒否する、ことを
含むことを特徴とする方法。

【００４７】17．第１６項記載の方法であって、登録さ
れる発声が最小しきい値長さより短いか否か判断するス
テップを含むことを特徴とする方法。

【００４８】18．第１７項記載の方法であって、発声が
前記最小しきい値長さより短い場合、該発声のテンプレ
ートを短縮ダイヤルリストに追加する前に、ユーザの承
認が得られるか否か判断することを特徴とする方法。

【００４９】19．音声認識データベースにアドレスを登
録する方法であって、アドレスの話者依存型テンプレー
トを用意するステップと、認識不能な音声のためにペナ
ルティ付加型不要要素モデルを用意するステップと、登
録されるアドレスを受信するステップと、登録されるア
ドレスが短すぎるか否か判断するステップと、を含むこ
とを特徴とする方法。

【００５０】20．電話システムに短縮ダイヤル名を登録
する方法であって、短縮ダイヤル名と、関連する電話番
号との話者依存型テンプレートを用意し、認識不能な音
声のためにペナルティ付加型不要要素モデルを用意し、
登録するための短縮ダイヤル名の発声をユーザから受信
し、登録のために受信した前記短縮ダイヤル名の発声の
テンプレートを生成し、登録される名前が、用意された
話者依存型テンプレートによく似ているか否か判断し、
よく似ている場合は登録を拒否し、不要要素モデルと一
致する場合は登録を許し、登録される発声が、最小しき
い値長さより短いか否か判断し、登録される発声が、前
記最小しきい値長さより短い場合、その発声を短縮ダイ
ヤルリストに登録する前にユーザが承認するか否か判断
し、登録される新しい短縮ダイヤル名の発声を再度繰り
返すことをユーザに要求し、受信した新しい短縮ダイヤ
ル名の２回目の発声を受信し、新しい短縮ダイヤル名の
２回目の発声を、生成したテンプレートおよびペナルテ
ィ付加型不要要素モデルと比較して一致しているか否か
判断し、一致している場合、前記新しい短縮ダイヤル名
のテンプレートを短縮ダイヤルリストに追加する、こと
を含むことを特徴とする方法。

【００５１】21．第２０項記載の方法であって、前記新
しい短縮ダイヤル名のテンプレートに関連する電話番号
を要求しかつ追加するステップを含むことを特徴とする
方法。

【００５２】22．第２１項記載の方法であって、比較に
失敗して一致しない場合、テンプレートと前記受信した
短縮ダイヤル名の２回目の発声を交換し、前記比較する
ステップを繰り返し実行するステップを含むことを特徴
とする方法。

【００５３】23．第２２項記載の方法であって、新しい
短縮ダイヤル名の３回目の発声を要求して受信し、前記
交換するステップが比較結果を得るのに失敗した後第３
の応答と２回目の発声が比較されそして一致している場
合、２回目の発声を短縮ダイヤルリストに入力するステ
ップを含むことを特徴とする方法。

【００５４】24．第２０項記載の方法であって、前記比
較ステップは、前記２回目の発声と前記ペナルティ付加
型不要要素モデルを比較して、所定の範囲内で前記ペナ
ルティ付加型不要要素モデルと一致する前記２回目の発
声中の発声をすべて拒否するステップを含むことを特徴
とする方法。

【００５５】25．短縮ダイヤル名を登録する電話装置で
あって、短縮ダイヤル名と、関連する電話番号との話者
依存型テンプレートを格納するメモリと、認識不能な音
声のためのペナルティ付加型不要要素モデルを格納する
メモリと、登録される名前と前記格納された話者依存型
テンプレートあるいは前記ペナルティ付加型不要要素モ
デルを比較して、よく似ている場合は登録を拒否する比
較器と、を含むことを特徴とする電話装置。

【００５６】26．第２５項記載の電話装置であって、登
録される発声が最小しきい値長さより短いか否か、ある
いは発声が前記最小しきい値長さより短い否か判断し、
発声のテンプレートを短縮ダイヤルリストに追加する前
に、ユーザが承認するか否か判断する手段を含むことを
特徴とする電話装置。

【００５７】27．短縮ダイヤル名を登録する電話装置で
あって、認識不能な音声のためのペナルティ付加型不要
要素モデルを格納する記憶装置と、登録するための短縮
ダイヤル名の発声をユーザから受信する受信器と、前記
受信器と結合し、登録するために受信した前記短縮ダイ
ヤル名の発声のテンプレートを発声させる発生器と、登
録される新しい短縮ダイヤル名の発声を再度繰り返すこ
とをユーザに要求する手段と、受信した新しい短縮ダイ
ヤル名の２回目の発声を受信することに応答して、前記
受信した新しい短縮ダイヤル名の２回目の発声と、発生
させたテンプレートおよびペナルティ付加型不要要素モ
デルを比較して、一致しているか否か判断する前記受信
器と、一致している場合、前記新しい短縮ダイヤル名の
テンプレートを短縮ダイヤルリストに追加する手段と、
を含むことを特徴とする電話装置。

【００５８】28．第２７項記載の電話装置であって、前
記新しい短縮ダイヤル名のテンプレートに関連する電話
番号を要求しかつ追加する手段を含むことを特徴とする
電話装置。

【００５９】29．第２７項記載の電話装置であって、前
記受信器は、比較に失敗して一致しない場合、テンプレ
ートと前記受信した短縮ダイヤル名の２回目の発声とを
交換しかつ再度比較する手段を含むことを特徴とする電
話装置。

【００６０】30．第２９項記載の電話装置であって、新
しい短縮ダイヤル名の３回目の発声を要求して受信し、
前記交換するステップが比較結果を得るのに失敗した後
第３の応答と２回目の発声が比較されそして一致してい
る場合、２回目の発声を短縮ダイヤルリストに入力する
手段を含むことを特徴とする電話装置。

【００６１】31．第２７項記載の電話装置であって、前
記受信器は、前記２回目の発声と前記ペナルティ付加型
不要要素モデルを比較して、所定の範囲内で前記ペナル
ティ付加型不要要素モデルと一致する前記２回目の発声
中の発声をすべて拒否する手段を含むことを特徴とする
電話装置。

【００６２】32．第３１項記載の電話装置であって、前
記受信器は、比較に失敗して一致しない場合、前記テン
プレートと前記２回目の受信した短縮ダイヤル名の発声
を交換しかつ再度比較するステップを繰り返し実行する
手段を含むことを特徴とする電話装置。

【００６３】33．第３２項記載の電話装置であって、前
記受信器は、新しい短縮ダイヤル名の３回目の発声を要
求して受信し、前記交換するステップが比較結果を得る
のに失敗した後３回目の発声と２回目の発声が比較され
そして一致している場合、短縮ダイヤルリストに２回目
の発声を入力する手段を含むことを特徴とする電話装
置。

【００６４】34．音声認識データベースに音声テンプレ
ートを登録する装置であって、認識不能な音声のための
ペナルティ付加型不要要素モデルを格納する記憶装置
と、前記データベースに登録するための新しい音声アド
レスの発声をユーザから受信する受信器と、前記受信器
と結合し、登録するために受信した前記新しい音声アド
レスの発声のテンプレートを発生させる発生器と、登録
される新しい音声アドレスの発声を再度繰り返すことを
ユーザに要求する手段と、前記受信した新しい音声アド
レスの２回目の発声を受信することに応答して、前記新
しい短縮ダイヤル名の２回目の発声と、発生させたテン
プレートおよびペナルティ付加型不要要素モデルを比較
して、一致しているか否か判断する前記受信器と、一致
している場合、前記新しいテンプレートを前記データベ
ースに追加する手段と、を含むことを特徴とする電話装
置。

【００６５】35．第３４項記載の電話装置であって、前
記受信器は、比較に失敗して一致しない場合、テンプレ
ートと前記２回目に受信した発声とを交換しかつ再度比
較する手段を含むことを特徴とする電話装置。

【００６６】36．第３５項記載の電話装置であって、３
回目の発声を要求して受信し、前記交換するステップが
比較結果を得るのに失敗した後第３の応答と２回目の発
声が比較されそして一致している場合、２回目の発声を
データベースに入力する手段を含むことを特徴とする電
話装置。

【００６７】37．第３４項記載の電話装置であって、前
記受信器は、前記２回目の発声と前記ペナルティ付加型
不要要素モデルを比較して、所定の範囲内で前記ペナル
ティ付加型不要要素モデルと一致する前記２回目の発声
中の発声をすべて拒否する手段を含むことを特徴とする
電話装置。

【００６８】38．短縮ダイヤル名を登録する方法とシス
テムには、話者依存型テンプレートと、関連する電話番
号とを用意することと、認識不能な音声のためのペナル
ティ付加型不要要素モデルを用意することとが含まれ
る。新しいテンプレートの要求が受信されると、短縮ダ
イヤル名のリストがいっぱいか否か判断され（ステップ
２０１）、いっぱいでない場合は、その名前が短縮ダイ
ヤルリストに既にある名前によく似ているか否か判断さ
れる。よく似ている場合、その名前は拒否されるが、似
ていない場合は、短縮ダイヤル名が短すぎるか否か判断
され、短すぎない場合、あるいは、ユーザが短い名前を
入力したい場合、システムは、短縮ダイヤル名を繰り返
すようにユーザに依頼し、一致すれば、その名前が入力
される。一致しない場合、システムは、１回目と２回目
の発声を交換して比較し、一致するか否か判断する。

【図面の簡単な説明】

【図１】本発明の方法を実現する電話システムを簡略化
したブロック図。

【図２】音声認識電話システムにおいて、多数ユーザが
発声した短縮ダイヤル命令を生成する方法の流れ図（fl
ow diagram）を示す図。

【図３】前記電話システムの中でディレクトリ名を登録
したり削除したりする一般的な流れ図を示す図。

【図４】前記電話システムにおけるディレクトリ名に対
応する短縮ダイヤルリストを登録したり修正したりする
方法の流れ図を示す図。

【図５】本発明の一実施例に従って、音声ダイヤルエン
トリ追加のフローチャートを示す図。

【図６】１つの不要要素モデルを示す図。

【図７】図５の音声ダイヤル追加エントリを登録するフ
ローチャートを示す図。

【図８】図７の音声ダイヤル追加エントリを更新するフ
ローチャートを示す図。

【図９】図８の音声ダイヤル追加エントリをリトライす
るフローチャートを示す図。

【符号の説明】

１０電話システム１１電話機１２プロセッサ、カウンタ、比較器１３オフフック検出器１４認識・記録装置１５メモリと内部のモデル１５ａ音声合成器

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁶ 識別記号庁内整理番号ＦＩ技術表示箇所Ｈ０４Ｍ 3/42 Ｇ０６Ｆ 15/40 ３７０Ｅ

Claims

【特許請求の範囲】

【請求項１】音声認識データベースに音声認識モデル
を登録する方法であって、異質な音声を解釈するペナルティ付加型不要要素モデル
を備え、登録するため音声認識する新しい発声をユーザから受信
し、登録のために受信した前記発声のテンプレートを生成
し、登録される発声を再度繰り返すことをユーザに要求し、２回目に受信した発声を受信し、２回目の発声を、生成したテンプレートおよびペナルテ
ィ付加型不要要素モデルと比較して一致しているか否か
判断し、語彙内音声に関して一致している場合、前記新しいテン
プレートを短縮ダイヤルリストに追加する、ことを含む
ことを特徴とする方法。
【請求項２】短縮ダイヤル名を登録する電話装置であ
って、短縮ダイヤル名と、関連する電話番号との話者依存型テ
ンプレートを格納するメモリと、認識不能な音声のためのペナルティ付加型不要要素モデ
ルを格納するメモリと、登録される名前と前記格納された話者依存型テンプレー
トあるいは前記ペナルティ付加型不要要素モデルを比較
して、よく似ている場合は登録を拒否する比較器と、を
含むことを特徴とする電話装置。