JPH1188502A

JPH1188502A - 音声応答メッセージング方法および装置

Info

Publication number: JPH1188502A
Application number: JP10095390A
Authority: JP
Inventors: Hunt Peter; ハントペーター; Albright Susana; アルブライトスザナー; Graiski Camille; グライスキーカミール; Love Leonard; ラブレオナード
Original assignee: Octel Communications Corp
Current assignee: Octel Communications Corp
Priority date: 1997-03-24
Filing date: 1998-03-24
Publication date: 1999-03-30
Also published as: US6522726B1; US6385304B1; CA2233019C; EP0867861A3; US6539078B1; CA2233019A1; US6377662B1; EP0867861A2; US6094476A

Abstract

(57)【要約】【課題】音声に応答して音声メッセージを送るための
方法であって、音声に応答するＶＭＳ（ＳＲＶＭＳ）が
加入者にメールボックス、パスワード、ディジットおよ
び（または）ディジットストリングの指定を可能にする
階層構成的に簡単な音声ＵＩを有利な仕方で備えている
方法を提供する。【解決手段】それぞれコマンドと発声との間の潜在的
な合致に対応する候補結果の集合を発生する過程と、複
数個の質しきいに従って候補結果の質を評価する過程
と、候補結果評価の質に従って音声ユーザーインタフェ
ース‐ナビゲーションオペレーションおよび音声メッセ
ージオペレーションの群からの１つを呼び出す過程とを
含んでいる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、音声メッセージお
よび音声認識の双方のためのシステムおよび方法に関す
る。一層詳細には、本発明は、音声メッセージ加入者に
より発せられる音声コマンドに応答して音声メッセージ
を送る方法および装置に関する。

【０００２】

【従来の技術】音声メッセージシステムは近年よく知ら
れるようになってきた。典型的な音声メッセージシステ
ム（ＶＭＳ）はデュアルトーン‐多重周波数（ＤＴＭ
Ｆ）、またはタッチトーン、音声メッセージユーザーイ
ンタフェース（ＵＩ）を通じて加入者と対話する。加入
者対話の間、ＶＭＳは、対応するオペレーションを開始
するべく１つまたはそれ以上のＤＴＭＦキーを押すよう
に加入者に要求する音声プロンプトを発する。加入者が
有効なＤＴＭＦキーシーケンスを押す場合には、ＶＭＳ
は特定のオペレーションセットを実行する。

【０００３】いくつかの環境のもとで、加入者の注意を
キーパッドに集中させることは加入者にとって不便であ
り、さらには危険であり得る。たとえば加入者が電話を
しながら運転または歩行している無線電話環境では、加
入者がＤＴＭＦキーの集合からオプションを選ぶ必要が
あることは、事故または困難な状況を招くおそれがあろ
う。その結果、コマンド、ユーザーインタフェースナビ
ゲーションおよびディジットおよび／またはディジット
ストリングの音声に基づく選択を通じて、ＶＭＳとのハ
ンドフリーな対話を行うための手段として、音声を使用
するためのシステムまたは方法が開発されてきた。

【０００４】当業者は、従来のＤＴＭＦ音声メッセージ
ＵＩが、一般にメニューのかなり複雑または大規模な階
層構成を有することを認識するであろう。音声に基づく
ＶＭＳ対話を行ういくつかのシステムは、単純に従来の
ＤＴＭＦ‐ＵＩと同一または本質的に同一のメニュー階
層構成を有する音声ＵＩを実行する。加入者が運転およ
びＶＭＳ対話のような多重のタスクを同時に実行しなけ
ればならない時、優先度が低いほうのタスクの複雑さを
減ずることが非常に重要である。こうして、この仕方で
音声ＵＩを実行するシステムは、ＶＭＳ対話の複雑さを
減ずるのに役立たないので、望ましくない。

【０００５】当業者は音声認識が厳密でないテクノロジ
ーであることを認識するであろう。ＤＴＭＦ信号と対照
的に、音声は制御されておらず、また大幅に変化し得
る。電話環境での音声認識の難しさはさらに増大する。
なぜならば、電話環境は狭い帯域幅、信号処理または変
換の多重ステージおよびかなりのノイズレベルにより特
徴付けられているからである。無線電話環境は特に、た
とえば車両エンジン、付近の通行または群衆のなかの音
声に起因して、ノイズが大きい傾向がある。

【０００６】加入者の意図を正しく決定することを容易
にするべく、音声に基づく音声メッセージシステムは高
いレベルの誤り防止および許容度を有し、また意図され
ないオペレーションを開始する確率を有意義に減じなけ
ればならない。すなわち、音声に基づく音声メッセージ
システムは、繰り返される音声認識の誤りが生じそうな
場合に、所望の音声メッセージタスクの集合を成功裡に
完了するための方策を加入者に与えなければならない。
従来の音声に基づく音声メッセージシステムはこれらの
観点の各々で不適当である。

【０００７】正しい加入者の意図の認識および加入者の
意図の決定と結び付けられる難しさは、最適なシステム
性能を達成するべく高レベルの支援および保守を必要と
する。特定の音声認識データおよびシステム性能尺度の
アベイラビリティは、この観点で、特にシステム検査お
よび問題解析に対して、非常に有用であり得る。従来の
システムおよび方法は、いつまたどのように音声認識デ
ータおよびシステム性能尺度が蓄積かつ（または）発生
されるかをフレキシブルに制御するための適当な手段を
備えていない。さらに、従来のシステムおよび方法は、
最大に有用な音声認識データ、すなわち実際の現場での
システム使用の間に発生される音声データ、を収集しな
い。従って、従来の欠点を克服する音声応答‐音声メッ
セージシステムおよび方法が必要とされる。

【０００８】

【発明が解決しようとする課題】本発明の課題は、音声
応答‐音声メッセージのためのシステムおよび方法であ
って、音声応答ＶＭＳ（ＳＲＶＭＳ）が加入者にメール
ボックス、パスワード、ディジットおよび（または）デ
ィジットストリングの指定を可能にする階層構成的に簡
単な音声ＵＩを有利な仕方で備えているシステムおよび
方法を提供することである。

【０００９】

【課題を解決するための手段】この課題は、本発明によ
れば、特許請求の範囲に記載されている方法により解決
される。

【００１０】ＳＲＶＭＳのなかで認識コマンド発生器お
よび音声およびロギング監視器が音声認識器のオペレー
ションを制御する。認識結果プロセッサが、語ごとに異
なり得る質しきいの集合に従って、音声認識器により発
生された候補結果の質を評価する。好ましい実施例で
は、認識結果プロセッサは、個々の候補結果が良いか、
疑わしいか、または悪いか、また２つまたはそれ以上の
候補結果が、各々のこのような結果が有効なコマンドで
あり得る有意義な確率に起因して、あいまいであるかど
うかをを決定する。認識結果プロセッサは追加的に最良
の候補結果を識別する。

【００１１】質評価の結果に基づいて、インタプリタ
が、音声ＵＩ構造、音声メッセージ機能ライブラリおよ
び認識コマンド発生器と共同して、音声ＵＩメニューま
たは音声メッセージ機能の呼び出しを通じてナビゲーシ
ョンを容易にする。もし認識結果プロセッサが、候補結
果が疑問またはあいまいであると決定したならば、イン
タプリタは、あいまいさレゾリューションＵＩ構造およ
び認識コマンド発生器と共同して、最良の候補結果が加
入者が意図したものであるかどうかを加入者に確認を促
す確認オペレーションを開始する。

【００１２】反復される音声認識の誤りに応答して、イ
ンタプリタが、ＤＴＭＦ‐ＵＩ構造および音声メッセー
ジ機能ライブラリと共同して、ＤＴＭＦ‐ＵＩへの転送
を開始する。ＤＴＭＦ‐ＵＩへの転送は、音声ＵＩがコ
ンテクストのなかにある間に加入者により発せられる予
め定められたＤＴＭＦ信号の検出に応答しても実行され
る。従って本発明の方法は、信頼性のあるバックアップ
ＵＩへの自動的な転送および加入者により選択された転
送の双方を行う。

【００１３】もし最良の候補結果が音声メッセージ機能
と合致するならば、インタプリタはディジットシーケン
スへの最良の候補結果のマッピングを開始し、また続い
て、ディジットシーケンスと対応する音声メッセージ機
能へ制御を転送する。本発明は音声ＵＩおよびＤＴＭＦ
‐ＵＩの双方を備えているので、候補結果のマッピング
は音声ＵＩが継目なしに標準ＤＴＭＦ‐ＵＩと重なり、
またＤＴＭＦ‐ＵＩに対して最初に書かれた機能を利用
することを許す。また、本発明は、音声ＵＩのコンテキ
ストのなかにとどまりながら、音声ＵＩおよびＤＴＭＦ
‐ＵＩの同時のアベイラビリティを容易にするのに、こ
のマッピングに頼っている。こうして、音声ＵＩのなか
の特定の位置またはロケーションにおいて、本発明は音
声もしくはＤＴＭＦ信号を音声ＵＩナビゲーションのた
めの有効な入力として成功裡に処理し得る。

【００１４】ＳＲＶＭＳは、こうして加入者の意図を成
功裡に決定するべく高いレベルの誤り許容度および誤り
防止を可能にし、またさらに音声ＵＩの部分と並列に，
または反復される音声認識誤りが生じていそうな状況で
バックアップとして、ＤＴＭＦ‐ＵＩへのアクセスを可
能にする。

【００１５】ロギングユニットおよび報告ユニットは、
加入者にトランスペアレントな仕方で音声ＵＩと並列に
作動する。ロギングユニットは加入者発声の選択的なロ
ギングを指令し、また報告ユニットは多重の詳細レベル
でのシステム性能統計を選択的に発生し、また維持す
る。

【００１６】本発明は、音声パラメータブロック（ＳＰ
ＡＢ）のなかに蓄積されている複数個のパラメータを通
じて、音声認識、候補結果の質の評価、発声ロギングお
よび性能報告をフレキシブルに制御する。各々のＳＰＡ
Ｂは好ましくは特定の音声ＵＩメニューに対応してい
る。

【００１７】

【実施例】本発明では、用語“加入者”は、音声メー
ル、メッセージ蓄積および転送およびメッセージ分配オ
ペレーションのような音声メッセージサービスへの直接
アクセスを有する特定の電話システムユーザーを指して
いる。用語“非加入者”および“非ユーザー”は、加入
者が非加入者のコールに答えるのに失敗する場合に、た
とえばページングダイアログに入り、または音声メッセ
ージをやめることにより、加入者に接触する能力のほか
には、音声メッセージサービスへの直接アクセスを有し
ていない電話システムユーザーを指している。用語“移
動加入者”および“移動非加入者”は移動電話ユーザー
またはセルラ電話ユーザーに対して類似に定義されてい
る。

【００１８】いま図１を参照すると、音声応答‐音声メ
ッセージシステム（ＳＲＶＭＳ）を使用する典型的な音
声メッセージ（ＶＭ）環境のブロック図が示されてい
る。典型的な音声メッセージ環境のなかで、ＳＲＶＭＳ
１０は報告システム１２に接続されている。追加的に、
中央局（ＣＯ）スイッチ２０は、加入者電話３０の集
合、非加入者電話４０の集合、公衆交換電話網（ＰＳＴ
Ｎ）５０およびＳＲＶＭＳ１０を接続する。ＰＳＴＮ５
０はさらにセルラ電話システムサービスエリア６０のな
かの移動電話交換局（ＭＴＳＯ）７０に接続されてい
る。ＭＴＳＯ７０は、１つまたはそれ以上の移動加入者
電話９０および移動非加入者電話９２への電話サービス
を行うべく、セルラ無線設備８０の集合と情報を交換す
る。ＳＲＶＭＳ１０を例外として、図１中に示されてい
る要素およびそれらの接続は好ましくは従来通常のもの
である。

【００１９】当業者は図１の典型的な音声メッセージ環
境に多くの変更が行われ得ることを認識するであろう。
たとえば、ＭＴＳＯ７０は、ＰＳＴＮ５０を通じてでは
なく、直接にＣＯスイッチ２０に接続され得よう。また
セルラ電話に向けられている要素は衛星電話を表す要素
により置換され得よう。図１中に示されている音声メッ
セージ環境は理解を助けるのに有用なものがあり、本発
明の応用可能な範囲を限定しない。

【００２０】ＳＲＶＭＳ１０は音声ユーザーインタフェ
ース（ＵＩ）を提供し、それを通じて加入者はＶＭサー
ビスオプションを選択するべく１つまたはそれ以上のメ
ニューを通じて言葉によりナビゲートし得る。当業者は
従来、特定のＳＲＶＭＳ機能の提供が移動および（また
は）非移動加入者の１つまたはそれ以上の特定の部分集
合に制限され得ることを理解するであろう。任意の所与
のメニューのコンテキストのなかの特定のコマンド語ま
たは句の加入者による発声に応答して、ＳＲＶＭＳ１０
は対応する音声メッセージサービスを呼び出す。

【００２１】いま図２を参照すると、加入者に提供する
音声ＵＩメニューオプションの好ましい最小の集合を示
すフロ−チャートが示されている。図２中に示されてい
る各メニューに対して、ＳＲＶＭＳ１０は加入者に音声
プロンプトを発する。好ましくは、音声プロンプトはタ
ーゲットコマンド語または句のリスト特定し、またオプ
ションにより、各ターゲットコマンド語または句が対応
する追加的な記述もしくは音声メッセージサービスを特
定する。図２中に示されているように、音声ＵＩメニュ
ーオプションの好ましい最小の集合は、加入者のメール
ボックス番号のエントリのためのメニューと、加入者の
パスワードのエントリのためのメニューと、それから管
理オペレーションまたはメッセージレビューメニューが
選択され得る主メニューと、メッセージレビューメニュ
ー自体とを含んでいる。追加的に、音声ＵＩメニューオ
プションの最小の集合は、特定のオペレーションをスキ
ップし、取消し、または確認するのためのサブメニュー
を提供する。当業者は、追加的なメニューおよび（また
は）サブメニューもメニューまたはサブメニューオプシ
ョンも提供され得ることを認識するであろう。たとえ
ば、当業者により容易に理解される仕方で、メニューは
メッセージを送り、メッセージに答え、またはメッセー
ジを転送するオプションを加入者に提供するべく追加さ
れ得ようし、またはメニューは取消オペレーションを支
援するべく追加され得ようことを認識するであろう。好
ましくは、それを通じて加入者がナビゲートしなければ
ならないメニューおよびサブメニューの全数は、使い易
さを促進するのに合理的な数に保たれている。典型的な
音声プロンプトは“メールボックス番号プリーズ”、
“パスワードプリーズ”および“”主メニュー：選択は
レビュー、チェインジグリーティング、チェインジパス
ワードおよびハングアップです”を含んでいる。高レベ
ルの意味を運ぶ短い音声プロンプトは、好ましくは、加
入者とＳＲＶＭＳ１０との間の対話の速度の最大化を助
けるべく各音声ＵＩメニューのなかで利用される。

【００２２】好ましい実施例では、音声ＵＩは、最小数
の音声ＵＩメニューを通じてのナビゲーションが音声メ
ッセージオペレーションのほとんどの共通の集合にアク
セスするのに必要とされるように設計されている。標準
のＤＴＭＦ‐ＵＩと対照的に、音声ＵＩは好ましくはよ
り多くのコマンドを特定のメニューのなかに組み入れて
おり、その結果としてＤＴＭＦ‐ＵＩよりも少数のメニ
ューとなっている。従って、好ましい音声ＵＩはＤＴＭ
Ｆ‐ＵＩよりも階層構成的に平らであると言われる。こ
の形式の音声ＵＩは、加入者の“学習曲線”を減じ、ま
た音声ＵＩのなかの特定のコマンドロケーションの記憶
を助けることにより使い易さを増進する。

【００２３】ＳＲＶＭＳ１０は、音声ＵＩを通じての言
葉によるナビゲーションが有用であり得る本質的に任意
のＶＭ環境に応用され得る。たとえば、ＳＲＶＭＳ１０
は本質的に任意の無線電話システムを含んでいるＶＭ環
境にも、開発途上国でそうかもしれないようにＤＴＭＦ
サービスが利用可能でないところでも応用され得る。

【００２４】システム構成いま図３を参照すると、本発明に従って構成された音声
応答‐音声メッセージシステム１０の好ましい実施例の
ブロック図が示されている。ＳＲＶＭＳ１０はシステム
制御ユニット１００と、ディスクおよび音声Ｉ／Ｏ制御
ユニット１６０と、データベースディレクトリエントリ
および各加入者に対するメールボックスが常駐している
データ蓄積ユニット１７０と、少なくとも１つのディジ
タルラインカード（ＤＬＣ）１８０と、電話インタフェ
ースコントローラ（ＴＩＣ）１８５と、システムマネー
ジャターミナル（ＳＭＴ）２５０とを含んでいる。ＳＲ
ＶＭＳ１０の要素は、従来通常の仕方で第１のコントロ
ールバス２６０および第１のデータバス２６２を介して
選択的に接続されている。各ＴＩＣ１８５は、従来通常
のようにＣＯスイッチ２０に接続されている。好ましい
実施例では、ディスクおよび音声Ｉ／Ｏ制御ユニット１
６０、データ蓄積ユニット１７０およびＳＭＴ２５０は
従来通常のものである。

【００２５】システム制御ユニット１００は、ＳＭＴ２
５０を介して受信されるシステムパラメータに従ってＳ
ＲＶＭＳ１０の全体作動を管理する。システム制御ユニ
ット１００は、好ましくはバスおよび直接記憶アクセス
（ＤＭＡ）コントローラ１１０と、処理ユニット１２０
と、メモリ１３０とを含む。このメモリ１３０内には、
音声メッセージ（ＶＭ）機能ライブラリ１３２、インタ
プリタ１３４、ＤＴＭＦＵＩ構造１３６、音声ＵＩ構
造１３８、およびあいまいさレゾリューションＵＩ構造
１４０、認識コマンド発生器１４２、認識結果プロセッ
サ１４４、ロギングユニット１４６、報告ユニット１４
８、音声パラメータブロックライブラリ１５０およびコ
ール統計ライブラリ１５２が常駐している。バスおよび
ＤＭＡコントローラ１１０と、処理ユニット１２０と、
メモリ１３０のなかの各要素とは内部バス２７０を介し
て接続されている。バスおよびＤＭＡコントローラ１１
０は、さらに第１のデータおよびコントロールバス２６
０、２６２、ＳＭＴ２５０にも報告システム１２にも接
続されている。好ましくは、バスおよびＤＭＡコントロ
ーラ１１０と報告システム１２との間に保たれる接続
は、多重プロトコルに従っての転送を許す多重の接続線
を含んでいる。

【００２６】ＤＬＣ１８０は、音声データをＣＯスイッ
チ２０と交換し、ＤＴＭＦ信号を処理し、システム制御
ユニット１００の指令のもとに音声認識およびロギング
オペレーションを実行する。ＤＬＣ１８０は、好ましく
はＤＬＣバスコントローラ１９０、ＤＬＣ処理ユニット
２００、コーダ／デコーダ（ＣＯＤＥＣ）２１０および
ＤＬＣメモリ２２０を含んでいる。音声認識器２２２、
ＤＴＭＦプロセッサ２２４、テンプレートライブラリ２
２６、ロギングバッファ２２８、音声およびロギング監
視器２３０、句拡張器２３２、自動応答ライブラリ２３
４、パルス符号変調（ＰＣＭ）データバッファ２３６お
よび信号コンディショナ２３８は、ＤＬＣメモリ２２０
のなかに常駐している。ＤＬＣメモリ２２０のなかの各
要素は、第２のデータバス２８０を介してＤＬＣバスコ
ントローラ１９０およびＤＬＣ処理ユニット２００に接
続されている。ＤＬＣバスコントローラ１９０は、第２
のコントロールバス２８２を介してＤＬＣ処理ユニット
２００に接続されている。追加的に、ＤＬＣバスコント
ローラ１９０は、第１のデータおよびコントロールバス
２６０、２６２に接続されている。ＣＯＤＥＣ２１０、
句拡張器２３２、信号コンディショナ２３８およびＤＴ
ＭＦプロセッサ２２４は、好ましくは従来通常のもので
ある。ＣＯＤＥＣ２１０は、ＰＣＭデータバッファ２３
６と電話インタフェースコントローラ１８５との間のＤ
ＭＡ形式のオペレーションを行うべく、ＰＣＭデータバ
ッファ２３６およびＤＬＣバスコントローラ１９０に接
続されている。

【００２７】主要な必要条件および機能能力成功裡の音声応答ＶＭを提供するためには、いくつかの
主要な互いに関係する必要条件が満足されなければなら
ない。これらの主要な必要条件とそれらの解決がＳＲＶ
ＭＳ１０のなかの個々の要素により容易にされる仕方と
を以下に説明する。

【００２８】Ｉ．第１の主要な必要条件は、加入者の発
声を検出し、また発声に相当する特定のコマンド語また
は句を識別する能力である。この能力はテンプレートラ
イブラリ２２６および自動応答ライブラリ２３４と共に
音声認識器２２２により与えられる。

【００２９】音声認識器２２２は好ましくは従来通常の
ものであり、また、コマンド語および（または）個別の
ディジットの検出が必要とされる時に離散的な認識モー
ドで、またはディジットストリングの検出が必要とされ
る時に連続的な認識モードで、加入者の発声の非発声者
依存性の認識を行う。音声認識器２２２は好ましくは、
以下に一層詳細に説明されるように、特定の条件の検出
により認識の試みを自動的に再開する接続された認識モ
ードでも認識を行う。連続的な認識モードにある時、音
声認識器２２２は個別のディジットの検出を容易にする
べく発声の前準備的な処理を行い得る。好ましい実施例
では、音声認識器２２２は追加的に発声者依存性または
発声者適応性の音声認識を行い得る。

【００３０】テンプレートライブラリ２２６は、当業者
に容易に理解される仕方で、語テンプレートと、音声認
識器２２２に対する音声ＵＩのなかの各有効コマンドを
定める対応する語識別（ＩＤ）とを記憶する。自動応答
ライブラリ２３４は、以下に一層詳細に説明されるよう
に、語テンプレートと、音声およびロギング監視器２３
０が非依存的に作用する自動応答コマンド語を定める対
応する語ＩＤとを記憶する。

【００３１】音声認識器２２２は、以下に一層詳細に説
明されるように、音声およびロギング監視器２３０の指
令のもとに認識の試みを開始する。認識の試みの間に、
音声認識器２２２は、加入者の発声と語彙との間の最も
緊密な合致を決定するべく試みる。ここで、語彙はテン
プレートライブラリ２２６のなかに記憶されている語テ
ンプレートの部分集合として定義されている。語彙は特
定の音声ＵＩメニューのなかの利用可能なコマンド語ま
たは句に対応する。こうして、語彙は特定の語テンプレ
ートの編成である。認識の試みが完了すると、音声認識
器２２２は認識結果を音声およびロギング監視器２３０
に戻す。好ましくは、認識結果は候補結果の集合を含ん
でおり、各々の候補結果は候補語ＩＤと各候補語ＩＤに
対応する少なくとも１つのスコアとを含んでいる。理解
を助けるべく、ここでは単一のスコアが各候補語ＩＤと
結び付けられていると仮定して説明する。予め決定され
た候補結果は、好ましくは、タイムアウト条件、アウト
‐オブ‐ボキャブリ語（ＯＶＷ）、解明不可能な誤りま
たは他の“合致可能でない”条件の生起を指示するため
に蓄積される。

【００３２】さまざまな認識器パラメータが音声認識器
２２２の作動の仕方を制御する。好ましい実施例では、
実行されるべき認識の形式、タイムアウト情報、最小お
よび最大受容可能なストリング長さ、特定の語彙の参
照、必要とされる候補結果の数およびスコア制御情報が
認識器パラメータにより指定され得る。

【００３３】ＩＩ．第２の主要な必要条件は音声認識器
２２２を制御するための適切な構造のコマンドを発する
能力である。これは認識コマンド発生器１４２および音
声およびロギング監視器２３０を通じて容易にされてい
る。インタプリタ１３４により発せられるコールに応答
して、認識コマンド発生器１４２が音声およびロギング
監視器２３０に認識パラメータ宣言を発する。好ましく
は、認識パラメータ宣言は先に説明された認識器パラメ
ータを指定する。認識パラメータ宣言に応答して、音声
およびロギング監視器２３０が音声認識器２２２を初期
化する。

【００３４】認識コマンド発生器１４２は追加的に音声
およびロギング監視器２３０に認識リクエストを発す
る。認識リクエストを受信すると、音声およびロギング
監視器２３０は音声認識器２２２に認識の試みを開始す
るべく指令する。音声およびロギング監視器２３０は追
加的に、特定のＤＴＭＦ信号およびハング‐アップ条件
の生起が検出され得るように、ＤＴＭＦプロセッサのオ
ペレーションを開始させる。

【００３５】音声認識器２２２が候補結果の集合を発生
した後に（またはＤＴＭＦプロセッサ２２４が結果を発
生した後に）、音声およびロギング監視器２３０が自動
応答オペレーションを実行し、もしくは候補結果の集合
を制御ユニットメモリ１３０に転送し、また結果処理オ
ペレーションを開始するべくインタプリタ１３４に値を
戻す。認識コマンド発生器により認識リクエストが発せ
られることにより開始し、インタプリタ１３４に値が戻
されることにより終了する事象のシーケンスは、ここで
は認識事象を呼ばれている。

【００３６】好ましい実施例では、音声およびロギング
監視器２３０は、音声認識器２２２が自動応答ライブラ
リ２３４のなかに記憶されている特定の自動応答コマン
ド語を検出している場合には、自動応答オペレーション
を実行する。好ましくは、自動応答語は“より速い”、
“より遅い”、“より強い”および“より弱い”を含ん
でいる。音声およびロギング監視器２３０は検出された
自動応答コマンド語に対応するオペレーションの集合を
実行する。“より速い”または“より遅い”の検出はそ
れぞれより速いまたはより遅いメッセージプレイバック
を結果として生じ、また“より強い”または“より弱
い”の検出はそれぞれボリューム増大または減少を結果
として生ずる。音声およびロギング監視器２３０はまた
特定の誤り条件の検出に応答して自動応答オペレーショ
ンを実行し得る。自動応答オペレーションは、好ましく
は、接続されている認識モードを介してイネーブルされ
る。自動応答オペレーションを実行した後、音声および
ロギング監視器２３０は最も新しい認識リクエストに従
って他の認識の試みを開始する。

【００３７】ＩＩＩ．成功裡の音声応答ＶＭを提供する
ための第３の主要な必要条件は候補結果の質を解析また
は評価する能力である。この能力は認識結果プロセッサ
１４４を通じて容易にされる。認識事象の完了に続い
て、認識結果プロセッサ１４４は候補結果が良いか、悪
いか、疑わしいかを決定する。認識結果プロセッサ１４
４により実行される詳細なオペレーションは図６を参照
して後で説明される。

【００３８】ＩＶ．成功裡の音声応答ＶＭを提供するた
めの第４の主要な必要条件は、音声ＵＩのどの部分が任
意の時点で加入者に与えられるかを制御し、また音声Ｕ
Ｉの１つの部分から他の部分への選択的に移行し、また
は認識結果プロセッサ１４４により実行される評価の結
果に基づいて音声メッセージ機能を呼び出す能力であ
る。この能力はインタプリタ１３４、音声ＵＩ構造１３
８およびＶＭ機能ライブラリ１３２を通じて容易にされ
る。

【００３９】好ましい実施例では、各ＵＩ構造１３６、
１３８、１４０は、ＵＩナビゲーションオペレーション
もしくはＶＭ機能を実行するプログラム命令のシーケン
スへの参照を階層的に編成するデータ構造を含んでい
る。各々のこのようなプログラム命令シーケンスは好ま
しくはＶＭ機能ライブラリ１３２のなかに記憶されてい
る。上記の階層的な編成は加入者に利用可能なメニュー
およびサブメニューに対応する。好ましい実施例では、
各ＵＩ構造１３６、１３８、１４０はツリーから成って
いる。

【００４０】音声ＵＩを実行するため、インタプリタ１
３４は音声ＵＩ構造１３６のなかの位置またはロケーシ
ョンへの参照を選択または維持する。音声ＵＩ構造１３
６のなかの現在のロケーションと、音声およびロギング
監視器２３０により戻された値と、認識結果プロセッサ
の候補結果集合評価の結果とに基づいて、インタプリタ
１３４がＶＭ機能ライブラリ１３２のなかの適切なプロ
グラム命令シーケンスへの制御転送を指令する。好まし
い実施例では、インタプリタ１３４は事象駆動ケース形
式のステートメントを介して制御転送を開始する。ＶＭ
機能の実行中に頂点に達する認識事象はここでは通信と
呼ばれている。

【００４１】本発明では、特定のＵＩはインタプリタ１
３４と、所与のＵＩ構造１３６、１３８、１４０と、所
与のＵＩ構造１３６、１３８、１４０により参照されて
いるＶＭ機能ライブラリ１３２のなかのプログラム命令
シーケンスの集合とを使用して実行される。こうして、
音声ＵＩ構造１３６と、インタプリタ１３４と、ＶＭ機
能の特定の群とは共同して本発明の音声ＵＩを実行す
る。同様に、ＤＴＭＦＵＩ構造１３６はインタプリタ１
３４およびＶＭ機能ライブラリ１３２と共に、好ましい
実施例では音声メッセージ‐ユーザーインタフェース‐
フォーラム（ＶＭＵＩＦ）標準に従って定義されている
ＤＴＭＦ‐ＵＩを実行する。あいまいさレゾリューショ
ンＵＩ構造１４０は、インタプリタ１３４およびＶＭ機
能ライブラリ１３２の部分とならんで、音声ＵＩのなか
の確認メニューを実行し、それを通じて加入者は、図７
を参照して後で詳細に説明されるように、依然の応答を
確認するように促される。

【００４２】当業者は各ＵＩがスレッディッド‐コード
技術、特にＦｏｒｔｈまたはＪａｖａのようなプログラ
ム言語のコンテキストのなかで一般的に定義されている
スレッディッド‐コード技術、に従って実行されること
を理解するであろう。任意の他のＵＩが当業者により容
易に理解されるような仕方で実行され得ようが、上記の
ようなＵＩの実行は、その結果として、異なるシステム
形式を横断しての移植性を高め、オペレーションを速く
し、記憶要求を減じ、またより簡単なシステム開発オペ
レーション試験を容易にする。

【００４３】Ｖ．成功裡の音声応答ＶＭを提供するため
の第５の主要な必要条件は、音声ＵＩと並列に利用可能
なＤＴＭＦ‐ＵＩの１つまたはそれ以上の部分を有する
能力と、認識誤りが反復して生じそうな状況のもとでバ
ックアップとしてＤＴＭＦ‐ＵＩに頼る能力とである。
この必要条件はインタプリタ１３４、ＶＭ機能ライブラ
リ１３２およびＤＴＭＦ‐ＵＩ構造１３６により満足さ
れる。音声ＵＩと並列に利用可能なＤＴＭＦ‐ＵＩを有
することは加入者入力の処理を、このような入力が音声
であるかＤＴＭＦ信号であるかにかかわりなく、容易に
する。この同時のＵＩの用意は、ａ）メールボックス番
号またはパスワードの加入者エントリが必要とされる時
のように、音声もしくはＤＴＭＦ信号を処理し、また音
声ＵＩのコンテキストのなかにとどまることが望ましい
状況、およびｂ）特定のＤＴＭＦ入力の受信に応答して
の音声ＵＩからＤＴＭＦ‐ＵＩへ転送することが望まし
い状況に備える。

【００４４】音声ＵＩへのバックアップとして役立つＤ
ＴＭＦ‐ＵＩの存在はＳＲＶＭＳ１０を、音声がＵＩナ
ビゲーションのための唯一の入力手段であるシステムよ
りも一層信頼性に富むものとする。音声認識に終始問題
がある状況のもとで、ＤＴＭＦ‐ＵＩは加入者にそのＶ
Ｍタスクの成功裡の完了を可能にする。

【００４５】当業者は、ＤＴＭＦ‐ＵＩへの転送が、Ｄ
ＴＭＦへのロータリ信号をマップするために利用可能な
ロータリダイヤリング検出およびマッピング機能が利用
可能でないかぎり、ＤＴＭＦが利用可能である電話環境
のなかでしか実行可能でないことを認識するであろう。
このような機能はたとえばラインカードに常駐している
ハードウェアおよび（または）ソフトウェアにより与え
られ得よう。当業者は、ロータリダイヤリングによる情
報のエントリにはかなりの時間がかかり得るので、非Ｄ
ＴＭＦ環境のなかに音声ＵＩを用意することが望ましい
ことであり得ることを認識するであろう。

【００４６】ＶＩ．成功裡の音声応答ＶＭを提供するた
めの第６の主要な必要条件は、加入者への選択的に割込
み可能なプロンプトおよびメッセージの発信を制御する
能力である。これはインタプリタ１３４と、ＵＩ構造１
３６、１３８、１４０と、ＶＭ機能ライブラリ１３２の
なかの少なくとも１つのＶＭ機能と、句拡張器２３２と
により容易にされている。好ましい実施例では、句拡張
器２３２はＤＴＭＦプロセッサ２２４および音声および
ロギング監視器２３０により発せられる信号に応答し、
また、ＤＴＭＦ信号が検出されるまで、または音声およ
びロギング監視器２３０が認識結果を認識結果プロセッ
サ１４４に戻すまで、プロンプトまたはメッセージを行
う。追加的に、プロンプトは、音声認識器２２２が（デ
ィジット‐ストリングの開始のような）認識可能な発声
の開始を検出する時には、より早い時点で停止され得
る。この能力はここで“バージ‐イン（ｂａｒｇｅ‐ｉ
ｎ）”と呼ばれており、また割込みコードの集合に従っ
て選択的に実行される。音声プロンプトまたはメッセー
ジ割込みが可能にされていることは加入者とＳＲＶＭＳ
１０との間の対話の速度の最大化を助ける。好ましい実
施例では、認識結果は自動応答オペレーションの後に認
識結果プロセッサ１４４に戻されず、従ってまたプロン
プトが自動応答オペレーションの間および後に行われ続
ける。

【００４７】ＶＩＩ．成功裡の音声応答ＶＭを提供する
ための第７の主要な必要条件は、ＳＲＶＭＳ性能情報を
選択的に発生しかつ解析する能力である。これはロギン
グユニット１４６、報告ユニット１４８および音声およ
びロギング監視器２３０により容易にされている。ＳＲ
ＶＭＳ性能情報の発生および解析は、問題を識別し、ま
たシステムが使用される仕方を追跡するために特に有用
である。ロギングユニット１４６および報告ユニット１
４８により行われる詳細なオペレーションは図８ないし
図１０を参照して後で説明される。

【００４８】制御パラメータ本発明は、音声認識事象の開始、評価、ロギングおよび
報告を制御するためのさまざまなパラメータに頼ってい
る。音声ＵＩのなかの各メニューに対して、ＳＰＡＢラ
イブラリ１５０のなかの対応するＳＰＡＢ３００がこれ
らのパラメータを記憶する。いま図４Ａを参照すると、
ＳＰＡＢ３００の好ましい実施例のブロック図が示され
ている。各ＳＰＡＢ３００は好ましくは、ロギングおよ
び報告パラメータのリストを記憶するための第１のデー
タフィールド３０２と、音声認識制御パラメータのリス
トと前記の割込みコードとを記憶するための第２のデー
タフィールド３０４と、後で詳細に説明される質しきい
のリストを記憶するための第３のデータフィールド３０
６と、音声メッセージ機能へ語ＩＤをマップするために
使用されるディジット‐マッピング‐リストを記憶する
ための第４のデータフィールド３０８と、語彙モジュー
ルへの参照のリストを記憶するための第５のデータフィ
ールド３１０とを含んでいるデータ構造である。

【００４９】ロギングパラメータは、ロギングユニット
が加入者の発声のロギングを指令する仕方を指定し、ま
た好ましくは下記を選択的に指定する条件コードを含ん
でいる：・ロギングがコール‐レベル、通信レベルまたは認識事
象レベルにおいて擬似ランダムであり、（決してないに
対する１０００あたり０からいつもに対する１０００あ
たり１０００までの範囲に及ぶ）それぞれ通信または認
識事象の１０００コールあたり特定の数に関して選択可
能であるかどうか；ＳＲＶＭＳポート番号；・１つまたはそれ以上の加入者メールボックス；・音声ＵＩのなかの１つまたはそれ以上のメニュー；・特定の語ＩＤ；・ロギングが生起すべき認識形式；・良い認識をログすべきかどうか；・悪い認識をログすべきかどうか；・疑わしい語または混乱した語対をログすべきかどう
か；・コマンドまたはディジットをログすべきかどうか；・ログされるべき特定の誤りまたはＯＶＷ条件；、およ
び・サンプリングパラメータ。

【００５０】サンプリングパラメータは音声およびロギ
ング監視器２３０により使用され、またロギングが生の
音声に対して生起すべきか、前処理された（すなわちエ
コーを消去された）音声に対して生起すべきかどうか
と、音声認識の間のどの点においてロギングがが開始し
また終了すべきかを指示するタイミング定義とを指定す
る。ロギングユニット１４６により実行される詳細なオ
ペレーションは図８、図９Ａおよび図９Ｂを参照して後
で説明される。

【００５１】報告パラメータは報告ユニット１４８が作
動する仕方を制御し、また、好ましくは、報告が生起す
べきかどうかと、報告が認識あたりベースで実行される
べきか、通信あたりベースで実行されるべきか、または
コールあたりベースで実行されるべきかを指示する制御
条件とを指定する。報告ユニット１４８により実行され
る詳細なオペレーションは図１０を参照して後で説明さ
れる。

【００５２】音声認識パラメータは音声認識器に対する
初期化および認識設定を指定する。好ましい実施例で
は、音声認識パラメータは、実行されるべき認識の形
式、タイムアウト情報、最小および最大の受容可能なス
トリング長さ、特定の語彙への参照、必要とされる候補
結果の数、スコア制御情報および誤り制御情報を指示す
る。

【００５３】いま図４Ｂをも参照すると、語彙モジュー
ル３２０の好ましい実施例のブロック図が示されてい
る。各語彙モジュール３２０は、語ＩＤのリストを記憶
するための第１のデータフィールド３２２と、各語ＩＤ
に対応する語または句を記憶するための第２のデータフ
ィールド３２４とを含んでいるデータ構造である。任意
の与えられた語彙モジュール３２０は、音声ＵＩの特定
のメニューのなかの加入者に利用可能なコマンド語また
は句を指定する。好ましい実施例では、ＳＰＡＢ３００
の集まりがＳＲＶＭＳ１０により支援される各言語に対
して存在している。

【００５４】実施例の詳細好ましい実施例では、インタプリタ１３４、認識コマン
ド発生器１４２、認識結果プロセッサ１４４、ロギング
ユニット１４６および方向ユニット１４８の各々は、処
理ユニット１２０により実行可能であり、またメモリ１
３０のなかに記憶されている一連のプログラム命令シー
ケンスを含んでいる。同様に、音声認識器２２２、ＤＴ
ＭＦプロセッサ２２４、音声およびロギング監視器２３
０、句拡張器２３２および信号コンディショナ２３８の
各々は、ＤＬＣ処理ユニット２００により実行可能であ
り、またＤＬＣメモリ２２０のなかに記憶されているプ
ログラム命令シーケンスを含んでいる。ＤＬＣ処理ユニ
ット２００は好ましくは市販品として入手可能なディジ
タル信号プロセッサ（ＤＳＰ）により実行されている。
当業者は、前記の要素の１つまたはそれ以上の部分がそ
の代わりに代替的な実施例のなかでハードウェアとして
実現されていてよいことを認識し、またＤＬＣ処理ユニ
ット２００がＤＳＰでなくてもよいことを理解するであ
ろう（たとえばＰｅｎｔｉｎｕｍプロセッサ（インテル
社、サンタクララ、ＣＡ）が使用され得よう）。

【００５５】典型的な実施例では、ＳＲＶＭＳ１０はシ
ステムコントローラメモリ１３０およびＤＬＣメモリ２
２０のなかに示されている要素と、ＤＬＣバスコントロ
ーラ１９０としての役割をする８０４８６マイクロプロ
セッサ（インテル社、サンタクララ、ＣＡ）と、Ｔｅｘ
ａｓＩｎｓｔｒｕｍｅｎｔｓＣ３１ＤＳＰ（Ｔｅｘ
ａｓＩｎｓｔｒｕｍｅｎｔｓ社、ダラス、ＴＸ）と、
高移植性認識器ライブラリ（ＰＲＬ）ソフトウェア（Ｖ
ｏｉｃｅＰｒｏｃｅｓｓｉｎｇ社、ケンブリッジ、Ｍ
Ａ）と、通常のＸ．２５カップリングおよびスモールコ
ンピュータシステムインタフェース（ＳＣＳＩ）バスを
介してバスおよびＤＭＡコントローラ１１０に接続され
ているＰｅｎｔｉｎｕｍまたは類似のプロセッサを有す
るパーソナルコンピュータとを有するＯｃｔｅｌＳｉ
ｅｒａシステム（ＯｃｔｅｌＣｏｍｍｕｎｉｃａｔｉ
ｏｎ社、ミルピタス、ＣＡ）である。代替的な実施例で
は、ＳＲＶＭＳ１０は“集積された音声メッセージを有
する電子メールシステム”という名称の米国特許第 5,5
57,659号明細書に記載されているもののような統合また
は集積された音声メッセージシステムのなかで実現され
得よう。このような実施例では、図３中に示されている
ＳＲＶＭＳ１０の要素は、当業者により容易に理解され
る仕方で、電子メールシステムに接続されている音声サ
ーバーのなかに常駐している。

【００５６】当業者は追加的に、、さらに他の実施例の
なかでＳＲＶＭＳ１０が単一プロセッサシステムのなか
で実現され得ることを認識するであろう。このような実
施例には、ＤＬＣ処理ユニット２００は存在しておらず
（または等価的に、ＤＬＣ処理ユニット２００および処
理ユニット１２０は１つの同じ要素であり）、また図１
のＤＬＣメモリ２２０のなかの要素２２２、２２４、２
２６、２２８、２３０、２３２、２３４、２３５、２３
８はその代わりに、ＴＩＣ１８５からのＤＭＡ形式の転
送が必要とされる場合のＣＯＤＥＣ２１０を例外とし
て、制御ユニットメモリ１３０のなかで実現されてい
る。

【００５７】詳細な作動前記のシステム要素が本質的に継目のない仕方で音声応
答ＶＭを実行するべく順次にかつ（または）並列に相互
作用する仕方は図５ないし図１０を参照して詳細に説明
される。

【００５８】いま図５を参照すると、本発明による音声
応答‐音声メッセージのための好ましい方法のフロ−チ
ャートが示されている。好ましい実施例では、図５で実
行される作動は、インタプリタ１３４がＤＬＣバスコン
トローラから受信された到来コール報知に応答して最初
のＳＰＡＢ３００への参照を認識コマンド発生器１４２
に転送する時に開始される。

【００５９】好ましい方法は認識コマンド発生器１４２
が考察のために最初のＳＰＡＢ３００を選択するステッ
プ５００で開始する。好ましい実施例では、最初のＳＰ
ＡＢ３００はメールボックス番号エントリメニューに対
応する。当業者は、最初のＳＰＡＢ３００が加入者への
音声ＵＩとＤＴＭＦ‐ＵＩとの間の選択の提供を容易に
し得るウェルカムメニューのようないくつかの他のメニ
ューに対応し得ることを認識するであろう。次に、認識
コマンド発生器１４２がステップ５０２で現在の選択さ
れたＳＰＡＢ３００のなかの認識器パラメータを検索
し、またステップ５０４で音声およびロギング監視器２
３０への認識パラメータ宣言を発する。それに従って、
続いて音声およびロギング監視器２３０は音声認識器２
２２を初期化する。次いで、ステップ５０６で、認識コ
マンド発生器１４２が認識リクエストを発し、それによ
り認識事象を開始する。ステップ５０６の後に、ＶＭ機
能ライブラリ１３２のなかの音声メッセージ機能が現在
のプロンプトを選択し、またステップ５０８で句拡張器
２３２へのプロンプト報知を発する。続いて、句拡張器
２３２が従来通常の仕方で、すなわちＰＣＭデータバッ
ファ２３６、ＣＯＤＥＣ２１０およびＴＩＣ１８５を介
して、加入者に現在のプロンプトを発する。プロンプト
は好ましくは、ＤＴＭＦ信号が検出されるまで、または
音声およびロギング監視器２３０が候補結果の集合を制
御ユニット１００に戻すまで発せられる。

【００６０】ステップ５０８に続いて、認識結果プロセ
ッサ１４４がステップ５１０で候補結果の集合を検索す
る。好ましい実施例では、インタプリタ１３４が、候補
結果の集合が評価を必要とすることを示す値を音声およ
びロギング監視器が戻すのに応答して、認識結果プロセ
ッサ１４４への制御転送を開始する。認識結果プロセッ
サ１４４は続いて、図６を参照して後で詳細に説明され
るように、ステップ５１２で戻された候補結果の質を評
価し、また好ましくはこの評価の結果を指示する値をイ
ンタプリタ１３４に戻す。

【００６１】認識結果プロセッサ１４４から受信された
値に基づいて、インタプリタ１３４が、認識がステップ
５１４で反復されるべきかどうかを決定する。もし認識
結果プロセッサの評価の結果が、加入者の応答が悪かっ
たことを指示し、かつ認識反復カウントが超過されてい
ないならば、認識が反復されなければならない。悪い応
答は、おそらくたとえば過大な背景音から生ずる期待さ
れた語ではないなんらかの意味を表す可聴事象に起因し
得よう。認識が反復されなければならない場合に、好ま
しい方法は他の認識事象を開始するべくステップ５０６
に戻ることである。好ましい実施例では、ステップ５０
８で発せられる現在のプロンプトは認識が反復された回
数に従って変化し得る。

【００６２】加入者の応答が悪く、かつ反復カウントが
超過された場合には、インタプリタ１３４はステップ５
１６および５１８を介してＤＴＭＦ‐ＵＩに移行する。
ステップ５１８の後に、この好ましい方法は終了する。

【００６３】もし認識反復もＤＴＭＦ‐ＵＩへの転送も
必要とされないならば、インタプリタ１３４は、認識確
認がステップ５２０で必要とされるかどうかを決定す
る。本発明では、確認は評価の結果が疑わしい応答また
はあいまいな応答を指示する時に必要とされる。もし確
認が必要とされるならば、インタプリタ１３４はあいま
いさレゾリューションＵＩ構造１４０のなかの位置また
はロケーションを選択し、また、図７を参照して後で詳
細に説明されるように確認オペレーションを開始するべ
く、ステップ５２２で確認ＳＰＡＢ３００への参照を認
識コマンド発生器１４２に転送する。ステップ５２２の
後に、インタプリタはステップ５２４で確認が成功裡で
あったかどうかを決定する。もし否定であれば、この好
ましい方法はステップ５０６に戻る。

【００６４】確認がステップ５２０で必要とされない
時、またはステップ５２４での成功裡の確認の後に、イ
ンタプリタ１３４はステップ５３０でディジット‐シー
ケンスへの最良の候補語ＩＤをマップするマッピング機
能に制御を転送する。マッピング機能はマッピング‐オ
ペレーションを実行するのに現在のＳＰＡＢ３００のな
かのデータ頼っている。インタプリタ１３４は続いてス
テップ５３２で、マップされたディジット‐シーケンス
が音声ＵＩナビゲーション‐オペレーションに相当する
かどうかを決定する。もし肯定であれば、インタプリタ
１３４はステップ５３４で音声ＵＩのなかの位置または
ロケーションを選択する。音声ＵＩナビゲーションでは
なくＶＭ機能が必要とされる場合には、インタプリタは
ステップ５３６で、マップされたディジット‐シーケン
スに相当するＶＭ機能に制御を転送する。好ましい実施
例では、ディジット‐シーケンスはシングル‐エンティ
ティとして解釈されている。

【００６５】メッセージ‐プレーバックを指令するＶＭ
機能は、メッセージが加入者に送られている間に加入者
の発声の認識および評価が選択的に実行されるように、
認識コマンド発生器１４２および認識結果プロセッサ１
４４と共同して作動する。このことはまたＳＲＶＭＳ１
０と加入者との間の相互作用速度の最大化を助ける。

【００６６】ステップ５３６の後に、インタプリタ１３
４はステップ５３８で通信カウントを更新する。ここ
で、通信は音声メッセージ機能の実行に最高潮に達する
音声ＵＩと加入者との成功裡の相互作用として定義され
ている。通信カウントは、図１０を参照して詳細に説明
されるように、方向ユニット１４８により選択的に利用
される。

【００６７】当業者はステップ５３０で発生されるディ
ジット‐シーケンスが、加入者がＤＴＭＦ‐ＵＩと相互
作用したものと同一の音声メッセージサービスをリクエ
ストするであろうＤＴＭＦコマンドのシーケンスに相当
することを理解するであろう。こうして、ステップ５３
０で実行されるマッピングは、ＳＲＶＭＳ１０がＤＴＭ
Ｆのみのシステムで音声メッセージ機能を実行するため
に最初に書かれた１つまたはそれ以上のプログラム命令
シーケンスを直接に使用することを許す。こうして、本
発明により提供される音声ＵＩは従来通常のＤＴＭＦ‐
ＵＩを部分的または完全にカバーし、可能性としてシス
テムの信頼性を高め、かつ（または）システムの開発時
間を短縮する。さらに、本発明により提供される音声Ｕ
Ｉは２つまたはそれ以上の非同一のＤＴＭＦ‐ＵＩを継
目なしにカバーし得る。

【００６８】ステップ５３４または５３８の後に、イン
タプリタ１３４はステップ５４０で加入者のコールが完
了しているかどうかを決定する。もし肯定であれば、こ
の好ましい方法は終了する。さもなければ、この好まし
い方法はステップ５００へ進み、そこでインタプリタ１
３４は考察のために適切なＳＰＡＢ５００を選択する。
コール完了は好ましくは、ＤＴＭＦプロセッサ２２４が
ハングアップ条件を検出する時、または“ハングアッ
プ”のようなコマンド語または句が成功裡に検出または
処理される時に指示される。

【００６９】好ましい実施例では、語“ヘルプ”の成功
裡の認識はインタプリタ１３４をして対応するヘルプＳ
ＰＡＢ３００の選択を介して音声ＵＩのなかの特定のヘ
ルプメニューに移行させる。好ましくは、主音声ＵＩメ
ニューからのコンテキスト感受性のユーザー‐アシスタ
ンスの実行を容易にするべく、さまざまなヘルプＳＰＡ
Ｂ３００が存在する。特定のヘルプＳＰＡＢ３００のイ
ンタプリタの選択はこうして、加入者がヘルプをリクエ
ストした音声ＵＩのなかの位置またはロケーションに基
づいている。

【００７０】いま図６を参照すると、音声認識結果を評
価するための好ましい方法（図５のステップ５１０およ
び図７のステップ７１０）のフロ−チャートが示されて
いる。この好ましい方法はステップ６００で、認識結果
プロセッサ１４４が候補結果の集合が回復不可能な誤り
またはタイムアウト条件が生起したことを指示するかど
うかを決定する。もし肯定であれば、認識結果プロセッ
サ１４４はステップ６０２で悪い結果の状態インディケ
ータを設定し、またステップ６０４で反復カウントをイ
ンクレメントする。確認結果の質を評価する時、認識結
果プロセッサ１４４は確認反復カウントをインクレメン
トし、さもなければ、認識結果プロセッサ１４４は認識
反復カウントをインクレメントする。もし適当な反復カ
ウント制限が超過されているならば、認識結果プロセッ
サ１４４はステップ６０６および６１０を介して対応す
る制限超過を設定する。適当な反復カウント制限が超過
されていない場合には、認識結果プロセッサ１４４はス
テップ６０８で反復状態インディケータを設定する。ス
テップ６０８もしくは６１０の後に、この好ましい方法
は終了する。

【００７１】もし誤りまたはタイムアウトが生起しなか
ったならば、認識結果プロセッサ１４４はステップ６２
０で第１の候補結果を選択する。認識結果プロセッサ１
４４は次いでステップ６２０で、選択された候補結果の
なかのスコアを選択された候補結果の語ＩＤに対応する
しきいスコアの群と比較する。好ましくは、記憶されて
いる音声ＵＩメニューのなかの各々の有効な語ＩＤに対
するしきいスコアは現在のＳＰＡＢ３００のなかに記憶
される。好ましい実施例では、第１のしきいスコアは、
それよりも上では候補結果が“良い”とみなされる第１
の質レベルを確立する。第２のしきいスコアは、それよ
りも下では候補結果が“悪い”とみなされる第２の質レ
ベルを確立する。第１の質レベルと第２の質レベルとの
間では、候補結果は“疑わしい”とみなされる。当業者
は代替的な実施例で“非常に良い”のような追加的な質
しきいが定義され得ることを認識するであろう。当業者
は、音声認識器が単一の候補語ＩＤに対して多重の形式
のスコアを戻す実施例では、別々の形式のしきいスコア
が類似に定義され得ることを認識するであろう。代替的
な実施例では、認識結果プロセッサ１４４は質評価を助
けるべく統計的言語モデリングを追加的に実行する。

【００７２】ステップ６２２の後で、認識結果プロセッ
サ１４４はステップ６２４でその質指定に従って現在選
定された候補結果をマークする。認識結果プロセッサ１
４４は次いで、ステップ６２６で他の候補結果が考察を
必要とするかどうかを決定する。もし肯定であれば、こ
の好ましい方法はステップ６２０に戻る。

【００７３】いったん各候補結果が考察され終わると、
認識結果プロセッサ１４４はステップ６３０で少なくと
も１つの候補結果が“良い”として指定されているかど
うかを決定する。もし肯定であれば、認識結果プロセッ
サ１４４はステップ６３２で、多重の良い候補結果が存
在しているかどうかを決定する。もしただ１つの候補結
果が“良い”として指定されているならば、認識結果プ
ロセッサ１４４はステップ６３８で良い結果の状態イン
ディケータを設定し、またステップ６４４でこの候補結
果に戻り、その後にこの好ましい方法は終了する。

【００７４】多重の良い候補結果が存在している時に
は、認識結果プロセッサ１４４はステップ６３４で各々
の良い候補結果の間のスコアの差を検査し、またステッ
プ６３６で最小のスコア差しきいが超過されているかど
うかを決定する。もし最小のスコア差しきいが超過され
ているならば、認識結果プロセッサ１４４はステップ６
２８で良い結果の状態インディケータを設定し、またス
テップ６４４でこの候補結果に戻り、その後にこの好ま
しい方法は終了する。好ましい実施例では、最良の候補
結果は、もし最小スコア差しきいが超過されるとすれ
ば、（語ＩＤと結び付けられたスコアにより指示される
ような）最小不確かさの良い候補結果として定義されて
いる。もし最小のスコア差しきいが超過されていないな
らば、認識結果プロセッサ１４４はステップ６４２で確
認が必要とされる状態に戻り、その後にこの好ましい方
法はステップ６４４に進む。こうして、本発明は、あい
まいではあっても良い可能性のある認識結果を加入者の
確認を要請して発生することを保証する。

【００７５】ステップ６３０で良い候補結果が存在して
いない場合には、認識結果プロセッサ１４４はステップ
６４０で疑わしい候補が存在しているかどうかを決定す
る。もし肯定であれば、この好ましい方法はステップ６
４２に進む。さもなければ、この好ましい方法はステッ
プ６０２に進む。好ましい実施例では、認識結果プロセ
ッサ１４４は、ストリングのなかの任意の所与の数の質
または有効性が決定されるように、ディジット‐ストリ
ングに対応すると期待される候補結果を評価する。

【００７６】いま図７を参照すると、音声認識結果を確
認するための好ましい方法（図５のステップ５４０）の
フロ−チャートが示されている。この好ましい方法は、
認識コマンド発生器１４２が確認ＳＰＡＢ３００のなか
のデータを検索するステップ７００で開始する。次に、
認識コマンド発生器１４２が音声およびロギング監視器
２３０に、確認ＳＰＡＢ３００のなかで指示されるよう
な認識器パラメータを設定する認識パラメータ宣言を発
する。

【００７７】音声メッセージ機能は次いでステップ７０
４で現在の確認プロンプトを決定し、また句拡張器２３
２に確認プロンプト報知を発する。好ましくは、加入者
がプロンプトの間に最良の語または句候補を与えられる
ように、確認プロンプト報知は現在の確認プロンプトに
確認を必要とする語または句の語ＩＤを加えたものへの
参照を含んでいる。たとえば、もし語“レビュー”が確
認を必要としたならば、現在の確認プロンプトに疑問の
ある語ＩＤを加えたものが“レビューと言いましたか？
イエスかノーで答えて下さい”というような仕方で加
入者に与えられるであろう。句拡張器２３２は当業者に
より容易に理解される仕方で加入者に現在の確認プロン
プトおよび考察されている語を発する。好ましい実施例
では、確認プロンプトの割込みは許されていない。

【００７８】ステップ７０４に続いて、認識コマンド発
生器１４２は認識リクエストを発し、それによりステッ
プ７０６で認識事象を開始する。音声およびロギング監
視器２３０は好ましくは制御ユニットメモリ１３０に確
認のために候補結果を戻し、また質評価が必要とされる
ことを指示する値をインタプリタに戻す。インタプリタ
１３４はそれに応答して認識結果プロセッサ１４４に制
御を転送する。

【００７９】ステップ７０８および７１０で、認識結果
プロセッサ１４４は、加入者が確認を促された後に、戻
された候補結果をそれぞれ検索かつ評価する。ステップ
７１０は前記の図６の説明に従って実行される。次に、
ステップ７１２で、インタプリタ１３４がステップ７１
２での確認結果が良かったかどうかを決定する。もし肯
定であれば、インタプリタ１３４はステップ７１２で成
功裡の確認の状態インディケータを設定し、その後に認
識コマンド発生器１４２はステップ７２０で先に選択さ
れたＳＰＡＢ３００（すなわち図５のステップ５００を
介して最も新たに選択されたＳＰＡＢ３００）のなかの
指定された認識器パラメータを再記憶する。ステップ７
２０の後で、この好ましい方法は終了する。

【００８０】もし確認の結果が良くなかったならば、イ
ンタプリタはステップ７１４で再確認が必要とされるか
どうかを決定される。再確認は好ましくは、認識結果プ
ロセッサ１４４が確認が必要とされる状態のインディケ
ータもしくは反復状態インディケータを設定している時
に必要とされる。再確認が必要とされている時、この方
法は好ましくは、他の認識事象を開始するべく、ステッ
プ７０６に戻る。好ましい実施例では、ステップ７０４
で発せられる現在の確認スロンプトは再確認が行われか
回数に従って変化する。

【００８１】もし認識結果プロセッサ１４４が確認制限
超過状態を設定しているならば、インタプリタ１３４は
ステップ７１４で再確認が必要とされないことを決定
し、またステップ７１６で不成功裡の確認状態のインデ
ィケータを設定する。ステップ７１６の後で、この好ま
しい方法はステップ７２０に進む。

【００８２】発声ロギング加入者の発声の記録または、ロギングはシステム検査お
よび検証、周期的な語彙構築および問題解析を助けるた
めに高度に有用である。しかし、発声ロギングはかなり
の記憶容量のメモリを必要とし、またこうしてロギング
はかなりの費用を要し得る。本発明では、ロギング費用
が最小化され得るように、ロギングおよび音声およびロ
ギング監視器２３０は各ＳＰＡＢ３００のなかで指定さ
れたロギングパラメータに従って加入者発声の選択的な
ロギングを制御する。

【００８３】いま図８を参照すると、本発明での発声ロ
ギングのための好ましい方法のフロ−チャートが示され
ている。好ましい実施例では、ロギングユニット１４６
はコールの間にトランスペアレントに作動し、インタプ
リタ１３４、認識コマンド発生器１４２および認識結果
プロセッサ１４４の作動をモニターする。この好ましい
方法は、ステップ８００で、ロギングユニット１４６
が、発声ロギングが現在のコールの間に必要とされるか
どうかを決定するべく、現在選択されているＳＰＡＢ３
００（すなわち図５のステップ５００で選択されたＳＰ
ＡＢ３００）のなかのロギングパラメータを検査するこ
とにより開始する。もし発声ロギングが現在のコールの
間に必要とされないならば、この好ましい方法は終了す
る。

【００８４】もし発声ロギングが必要とされるならば、
ロギングコントローラ１４６はステップ８０２でロギン
グパラメータに従って現在のロギング条件を確立する。
好ましい実施例では、ロギングパラメータは、先に図４
Ａに関して説明されたように、ロギングが必要とされる
種々の条件を指示する。ロギングユニット１４６は次い
でステップ８０４で、次の認識事象がログされるべきか
どうかを決定する。もし肯定であれば、ロギングユニッ
ト１４６はステップ８０６で音声およびロギング監視器
２３０にサンプリングパラメータの集合を発する。サン
プリングパラメータは好ましくは発声ロギングが下記の
参照時間定義に従って開始すべきかどうかを決定する：・認識の試みの開始時；・ここで“音声の開始”として定義されているように、
音声を示唆する音量およびスペクトル成分を有するオー
ディオ信号が検出された時；および・ここで“発声の開始”として定義されているように、
音声認識器２２２が発声が有意義であることを確信して
おり、またテンプレート合致プロセスを開始している
時。

【００８５】サンプリングパラメータは追加的に、発声
ロギングが下記の参照時間定義に従って終了すべきかど
うかを決定する：・発声ロギングの開始以後に予め定められた時間が経過
した後；・ここで“音声の終了”として定義されているように、
音声らしいデータが検出された後；・ここで“発声の終了”として定義されているように、
候補結果が発生された後。

【００８５】いま図９Ａをも参照すると、上記のように
定義された参照時間のグラフィック表示が示されてい
る。上記の参照時間を評価の際の時間遅れを補うべく、
バッファが好ましくは、サンプリング周期が示されてい
る開始および終了時点に対して相対的に近似的に０．５
ないし１秒延長され得るように、最も新しい１秒間隔に
相当するオーディオデータを保持する。音声およびロギ
ング監視器２３０は認識の試みの間のロギングを指令
し、またロギングバッファ２２８のなかにログされた発
声を蓄積する。

【００８６】再び図８を参照すると、ステップ８０６の
後に、ロギングユニット１４６がステップ８０８で認識
結果プロセッサ１４４が現在の候補結果に対する質評価
を完了しているかどうかを決定する。もし否定であれ
ば、この好ましい方法はステップ８０８にとどまる。い
ったん最も新しい認識事象の最終結果が知られていれ
ば、ロギングユニット１４６がステップ８０８でロギン
グパラメータのなかで指定されたどの規範も適合されて
いるかどうかを決定する。もし肯定であれば、ロギング
ユニット１４６が音声およびロギング監視器２３０に、
ステップ８１２で発声ヘッダーおよび最も新しい認識事
象の間に記録された発声を蓄積するように命令する。発
声ヘッダーは好ましくは音声ＵＩのなかの位置またはロ
ケーションへの参照と、再度の試みのカウントと、通信
カウントと、音声認識器２２２により発生された候補結
果の集合と、認識器により発せられたタイミングデータ
と、プロンプトの実行および割込みに関係付けられるタ
イミングデータと、ＤＴＭＦ信号またはハング‐アップ
のような外部事象の到来に対応するタイミングデータと
を含んでいる。発声自体は好ましくは８ビットｍｕ‐ｌ
ａｗプロトコルに従ってコード化されている。各々の発
声ヘッダーおよび対応する発声は好ましくはロギングバ
ッファ２２８のなかの利用可能な記憶ロケーションへの
参照またはポインタにより与えられるロケーションにお
いてロギングバッファ２２８のなかに蓄積される。ロギ
ングユニット１４６は好ましくはこのポインタを維持す
る。ステップ８１２が完了すると、ロギングユニット１
４６は現在のロギングパラメータを検査し、また蓄積さ
れた発声がステップ８１６でその後の使用のために保持
されるべきかどうかを決定する。特定の環境のもとで
は、ログされた発声が蓄積されるべきかどうかの知識
は、加入者のコールが音声ＵＩのなかの特定の点に進み
終わるまで確かめられ得ない。たとえば、ロギングの開
始は好ましくはコールの開始時に生起する。しかし、も
しロギングが特定のパスワード番号に対して生起すべき
であれば、加入者のパスワード番号は、コールがパスワ
ードエントリメニューのコンテキストのなかでなされた
加入者の発声が成功裡に認識かつ処理され終わる点に進
み終わるまで、知られていない。

【００８７】もし発声データが保持されているべきであ
れば、ロギングユニット１４６はステップ８１６で次の
利用可能なロケーションへのロギングバッファ‐記憶ロ
ケーション参照を更新する。

【００８８】ステップ８１６の後で、またはステップ８
０４、８１０および８１４の後で、ロギングユニット１
４６はステップ８１８で現在のコールが完了しているか
どうかを決定する。もし否定であれば、この好ましい方
法はステップ８０４に戻る。現在のコールが完了した後
に、ロギングユニット１４６がステップ８２０でコール
ヘッダーを発生し、また続いてステップ８２２でデータ
記憶ユニット１７０もしくは報告システムにコールヘッ
ダー情報と蓄積された発生の集合とを転送する。好まし
い実施例では、コールヘッダー情報はメールボックスＩ
Ｄと、タイムスタンプと、可能性として、図１９を参照
して後で詳細に説明されるカストマー‐データ‐レコー
ド（ＣＤＲ）への参照とを含んでいる。ステップ８２２
の後で、この好ましい方法は終了する。

【００８９】いま図９Ｂを参照すると、好ましい発声記
憶形式９００のブロック図が示されている。好ましい発
声記憶形式のなかで、コールヘッダー９０２は発声ヘッ
ダー／発声オーディオデータ‐シーケンス９０４により
続かれている。ロギングバッファ２２８のなかに、現在
のロギング‐ロケーションおよび以前のロギング‐ロケ
ーションへのポインタが当業者により容易に理解される
仕方で維持されている。

【００９０】報告システム性能データの発生はシステム問題解析のために
高度に有用である。本発明では、報告ユニット１４８
は、特定のシステム性能統計を蓄積する種々のカストマ
ー‐データ‐レコード（ＣＤＲ）を選択的に発生する。
好ましい実施例では、報告ユニット１４８はコールの間
にトランスペアレントに作動し、また、各ＳＰＡＢ３０
０のなかで指定された報告パラメータに従ってシステム
性能を追跡し、またＣＤＲを発生するべく、インタプリ
タ１３４、認識コマンド発生器１４２および認識結果プ
ロセッサ１４４をモニターする。各ＣＤＲの発生のため
に、報告ユニット１４８はコール統計ライブラリのなか
の統計の集合を維持する。

【００９１】好ましい実施例では、報告ユニット１４８
は認識‐レベルＣＤＲ、通信‐レベルＣＤＲ、コール‐
レベルＣＤＲおよび（または）合計‐レベルＣＤＲを選
択的に発生する。認識‐レベルＣＤＲは好ましくは下記
のことを指定する：・通信のなかの各認識の結果；・現在のＳＰＡＢ３００のなかで指定されるような、予
め定められた認識結果へのシステムの応答；・各認識に対するロギング状態；各認識事象の継続時間；および各認識事象に対する候補
語ＩＤおよび対応するスコア。

【００９２】下記のことは好ましくは通信‐レベルＣＤ
Ｒにより指定される：・通信に続いて行われる作用を指示する結果；・ＳＭＴ２５０により指定されている予め定められた数
の認識の試みを必要とする加入者入力の割合；・正しくない試みの数；・タイムアウトの数；・肯定的な確認が生起したかどうか；および・通信の継続時間。

【００９３】コール‐レベルＣＤＲは下記の情報を提供
する：・音声が使用されたコールの割合；・音声が使用されたディジット‐ストリングの割合；・予め定められた数の認識の試みを必要とするディジッ
ト‐ストリング入力の割合；・タイムアウトが生起した認識事象の割合；・確認を必要とする認識事象の割合；・失敗した認識事象の割合；・認識事象の平均継続時間；・平均通信継続時間。

【００９４】最後に、合計‐レベルＣＤＲは下記の情報
を含んでいる：・加入者がＤＴＭＦの使用に戻ったコールの割合；・ＳＲＶＭＳ１０がＤＴＭＦ‐ＵＩに戻ったコールの割
合；・音声ＵＩが再び呼び出されたコールの割合；および・ハング‐アップ条件が不成功裡の認識に続いたコール
の割合。

【００９５】当業者は前記の情報が発生され、かつ（ま
たは）インタプリタ１３４、認識コマンド発生器１４
２、認識結果プロセッサ１４４、音声およびロギング監
視器および音声認識器２２２により実行されるオペレー
ションを追跡することにより更新される仕方を容易に理
解するであろう。当業者は追加的に、特定の情報の有用
さに従って、追加的なまたはより少数の統計が代替的な
実施例で発生され得ることを認識するであろう。

【００９６】いま図１０を参照すると、カストマー‐デ
ータ‐レコードを創造するための好ましい方法が示され
ている。この好ましい方法は、ステップ１０００で報告
ユニット１４８が、現在の報告条件を確立するべく、現
在のＳＰＡＢ３００のなかで指定された報告パラメータ
を検索することにより開始する。次に、報告ユニット１
４８はステップ１００２で認識‐レベルＣＤＲが発生さ
れるべきかどうかを決定する。もし肯定であれば、報告
ユニット１４８はステップ１００４および１００６で認
識結果および認識結果表プロセスをモニターし、また認
識統計を発生かつ（または）更新する。

【００９７】ステップ１００４またはステップ１００６
の後で、報告ユニット１４８がステップ１００８で現在
の通信が完了しているかどうかを決定する。もし否定で
あれば、この好ましい方法はステップ１００２に戻る。
いったん現在の通信が完了しているならば、報告ユニッ
ト１４８がステップ１０１０で通信‐レベルＣＤＲの発
生が必要とされるかどうかを決定する。もし肯定であれ
ば、報告ユニット１４８はステップ１０１２で通信統計
を発生かつ（または）更新する。ステップ１０１０また
はステップ１０１２の後で、報告ユニット１４８は、ス
テップ１０１４で現在のコールが完了しているかどうか
を決定する。もし否定であれば、この好ましい方法はス
テップ１００２に戻る。

【００９８】現在のコールが完了すると、報告ユニット
１４８はコール‐レベルＣＤＲが発生されるべきかどう
かを決定する。もし肯定であれば、報告ユニット１４８
はそれぞれステップ１０１６および１０１８でコール統
計を発生かつ（または）更新する。もしコール‐レベル
ＣＤＲの発生が必要とされないならば、またはステップ
１０１８の後に、報告ユニット１４８は、コール統計ラ
イブラリ１５２のなかに維持されている統計を使用し
て、ステップ１０２０で各々の必要とされるＣＤＲを発
生する。好ましくは、各ＣＤＲは、適切な統計情報が常
駐しているデータファイルを含んでいる。ＣＤＲが発生
され終わった後、報告ユニット１４８は報告システム１
２へのそれらの転送を指令する。

【００９９】本発明を特定の好ましい実施例を参照して
説明してきたが、当業者は種々の変更が行われ得ること
を理解するであろう。たとえば、発声者に関係する認識
が加入者により発生される対応するディジット‐ストリ
ングを有するキーワードを置換するのに使用され得よ
う。本発明に対するこの変更およびここに記載された実
施例のコンテキストのなかにある他の変更は、特許請求
の範囲によってのみ限定される本発明の範囲内にあるも
のとする。

【図面の簡単な説明】

【図１】本発明が機能する典型的な音声メッセージ環境
のブロック図。

【図２】本発明により音声メッセージ加入者に提供され
る音声ユーザーインタフェースメニューの好ましい最小
の集合のフロ−チャート。

【図３】本発明に従って構成された音声応答‐音声メッ
セージの好ましい実施例のブロック図。

【図４】本発明の音声パラメータブロック（Ａ）および
語彙モジュール（Ｂ）の好ましい実施例のブロック図。

【図５】本発明に従って音声に応答して音声メッセージ
を送るための好ましい方法のフローチャート

【図６】本発明で音声認識結果を評価するための好まし
い方法のフロ−チャート。

【図７】本発明で音声認識結果を確認するための好まし
い方法のフロ−チャート。

【図８】本発明で発声をロギングするための好ましい方
法のフロ−チャート。

【図９】発声サンプリングに関係付けられた参照時間の
グラフィックな表示（Ａ）と本発明での好ましい発声記
憶形式のブロック図（Ｂ）。

【図１０】本発明でカストマーデータレコードを発生す
るための好ましい方法のフロ−チャート。

【符号の説明】

６０セルラ電話システムサービスエリア７０移動電話交換局（ＭＴＳＯ）８０セルラ無線設備９０移動加入者電話９２移動非加入者電話１００システム制御ユニット１３０制御ユニットメモリ１８０ディジタルラインカード（ＤＬＣ）２２０ＤＬＣメモリ２６０第１のコントロールバス２６２第１のデータバス２８０第２のデータバス２８２第２のコントロールバス３００音声パラメータブロック（ＳＰＡＢ）３２０語彙モジュール９００発声記憶形式

フロントページの続き (51)Int.Cl.⁶ 識別記号ＦＩＧ１０Ｌ 3/00 ５６１Ｇ１０Ｌ 3/00 ５６１Ｂ５７１５７１ＬＨ０４Ｍ 3/50 Ｈ０４Ｍ 3/50 Ａ (72)発明者スザナーアルブライトアメリカ合衆国 94025 カリフオルニアメンロパークカレツジアヴエニユー 709 (72)発明者カミールグライスキーアメリカ合衆国 94025 カリフオルニアサンホセアペニーズサークル 5292 (72)発明者レオナードラブアメリカ合衆国 94086 カリフオルニアサニーヴエイル＃3046 エスカロンアヴエニユー 100

Claims

【特許請求の範囲】

【請求項１】音声に応答して音声メッセージを送るた
めの方法において、ａ）それぞれコマンドと発声との間の潜在的な合致に対
応する候補結果の集合を発生する過程と、ｂ）複数個の質しきいに従って候補結果の質を評価する
過程と、ｃ）候補結果評価の質に従って、音声ユーザーインタフ
ェース‐ナビゲーションオペレーションおよび音声メッ
セージオペレーションの群からの１つを呼び出す過程と
を含んでいることを特徴とする音声応答メッセージング
方法。
【請求項２】デュアルトーン‐多重周波数（ＤＴＭ
Ｆ）信号に応答して音声メッセージを送ることを特徴と
する請求項１記載の方法。
【請求項３】前記ステップａ）が、発声の検出と発声
に相当する句の特定のコマンド語の識別とを含み、その
際該検出および／または識別は、好ましくはテンプレー
トライブラリ（２２６）および自動応答ライブラリ（２
３４）と共に音声認識器（２２２）により実行され、音
声認識器（２２２）は好ましくは認識コマンド発声器
（１４２）および音声およびロギング監視器（２３０）
により制御されることを特徴とする請求項１または２記
載の方法。
【請求項４】前記ステップｃ）が、音声ユーザーイン
ターフェースのどの部分が加入者に与えられるかを制御
し、音声ユーザーインターフェースの１つの部分から他
の部分へ選択的に移行し、または前記ステップｂ）にお
いて実行される評価の結果に基づいて音声メッセージ機
能を呼び出す過程を含み、この制御、移行および／また
は呼出しステップはインタプリタ（１３４）、音声ユー
ザーインターフェース（ＵＩ）構造（１３８）および音
声メッセージ（ＶＭ）機能ライブラリ（１３２）を通じ
て容易にされることを特徴とする請求項１ないし３の１
つに記載の方法。
【請求項５】加入者への選択的に割込み可能なプロン
プトおよびメッセージが発信され、その際この発行を制
御するステップは、これはインタプリタ（１３４）と、
ユーザーインターフェース構造（１３６、１３８、１４
０）と、音声メッセージ機能ライブラリ（１３２）のな
かの少なくとも１つの音声メッセージ機能と、句拡張器
（２３２）とにより容易にされ、その際好ましくは、句
拡張器（２３２）はＤＴＭＦプロセッサ（２２４）およ
び音声およびロギング監視器（２３０）により発せられ
る信号に応答し、音声認識器（２２２）に接続されてい
ることを特徴とする請求項１ないし４の１つに記載の方
法。
【請求項６】ＤＴＭＦユーザーインターフェースの１
つまたはそれ以上の部分が音声ユーザーインターフェー
スと並列に利用可能であり、ＤＴＭＦユーザーインター
フェースは、認識誤りが反復して生じそうな状況のもと
でバックアップとして働き、この機能はインタプリタ
（１３４）、音声メッセージ機能ライブラリ（１３２）
およびＤＴＭＦユーザーインターフェース構造（１３
６）により容易にされ、音声応答メッセージングシステ
ム（ＳＲＶＭＳ）性能情報が選択的に発生かつ解析さ
れ、これはロギングユニット（１４６）、報告ユニット
（１４８）および音声およびロギング監視器（２３０）
により容易にされていることを特徴とする請求項１ない
し５の１つに記載の方法。
【請求項７】音声応答メッセージングシステム（ＳＲ
ＶＭＳ）（１０）は、システム制御ユニット（１００）
と、ディスクおよび音声Ｉ／Ｏ制御ユニット（１６０）
と、データベースディレクトリエントリおよび各加入者
に対するメールボックスが常駐しているデータ蓄積ユニ
ット（１７０）と、少なくとも１つのディジタルライン
カード（ＤＬＣ）（１８０）と、各ＤＬＣ（１８０）に
対応する電話インタフェースコントローラ（ＴＩＣ）
（１８５）と、システムマネージャターミナル（ＳＭ
Ｔ）（２５０）とを含み、音声応答メッセージングシス
テム（１０）の要素は第１のコントロールバス（２６
０）および第１のデータバス（２６２）を介して選択的
に接続され、各ＴＩＣ（１８５）は中央局（ＣＯ）スイ
ッチ（２０）に接続されており、システム制御ユニット
（１００）はＳＭＴ（２５０）を介して受信されるシス
テムパラメータに従ってＳＲＶＭＳ（１０）の全体作動
を管理し、ＤＬＣ（１８０）は音声データをＣＯスイッ
チ（２０）と交換し、ＤＴＭＦ信号を処理し、システム
制御ユニット（１００）の指令のもとに音声認識および
ロギングオペレーションを実行することを特徴とする音
声応答メッセージング装置。
【請求項８】システム制御ユニット（１００）は、以
下のコンポーネントの少なくとも１つ、バスおよび直接
記憶アクセス（ＤＭＡ）コントローラ（１１０）と、処
理ユニット（１２０）と、メモリ（１３）とを含み、該
メモリ（１３）中には、音声メッセージ（ＶＭ）機能ラ
イブラリ（１３２）、インタプリタ（１３４）、ＤＴＭ
Ｆユーザーインターフェース構造（１３６）、音声ユー
ザーインターフェース構造（１３８）、およびあいまい
さレゾリューションＵＩ構造（１４０）、認識コマンド
発生器（１４２）、認識結果プロセッサ（１４４）、ロ
ギングユニット（１４６）、報告ユニット（１４８）、
音声パラメータブロック（ＳＰＡＢ）ライブラリ（１５
０）およびコール統計ライブラリ（１５２）が常駐して
おり、バスおよびＤＭＡコントローラ（１１０）と、処
理ユニット（１２０）と、メモリ（１３０）のなかの各
要素とは内部バス（２７０）を介して接続されており、
バスおよびＤＭＡコントローラ（１１０）はさらに第１
のデータおよびコントロールバス（２６０、２６２）、
ＳＭＴ（２５０）にも報告システム（１２）にも接続さ
れており、バスおよびＤＭＡコントローラ（１１０）と
報告システム（１２）との間の接続は、多重の接続線を
含んでおり、ＤＬＣ（１８０）は、ＤＬＣバスコントローラ（１９
０）、ＤＬＣ処理ユニット（２００）、コーダ／デコー
ダ（ＣＯＤＥＣ）（２１０）およびＤＬＣメモリ（２２
０）を含み、その際ＤＬＣメモリ（２２０）は、音声認
識器（２２２）、ＤＴＭＦプロセッサ（２２４）、テン
プレートライブラリ（２２６）、ロギングバッファ（２
２８）、音声およびロギング監視器（２３０）、句拡張
器（２３２）、自動応答ライブラリ（２３４）、パルス
符号変調（ＰＣＭ）データバッファ（２３６）および信
号コンディショナ（２３８）を含み、その際ＤＬＣメモ
リ（２２０）のなかの各要素は、第２のデータバス（２
８０）を介してＤＬＣバスコントローラ（１９０）およ
びＤＬＣ処理ユニット（２００）に接続され、ＤＬＣバ
スコントローラ（１９０）は、第２のコントロールバス
（２８０）を介してＤＬＣ処理ユニット（２００）に、
かつ第１のデータおよびコントロールバス（２６０、２
６２）に接続され、ＣＯＤＥＣ（２１０）は、ＰＣＭデ
ータバッファ（２３６）と電話インタフェースコントロ
ーラ（１８５）との間のＤＭＡ形式のオペレーションを
行うべく、ＰＣＭデータバッファ（２３６）およびＤＬ
Ｃバスコントローラ（１９０）に接続されていることを
特徴とする請求項７記載の装置。
【請求項９】以下のステップ、ａ）ＤＬＣバスコントローラ（１９０）からインタプリ
タ（１３４）に到来したコール報知を受信し、ｂ）コール報知に応答して最初の音声パラメータブロッ
ク（ＳＰＡＢ）（３００）への参照をインタプリタ（１
３４）から認識コマンド発生器（１４２）に転送し、ｃ）認識コマンド発生器（１４２）により最初のＳＰＡ
Ｂ（３００）を選択し（５００）、ｄ）認識コマンド発生器（１４２）は選択されたＳＰＡ
Ｂ（３００）のなかの少なくとも１つの認識器パラメー
タを検索し（５０２）、ｅ）認識コマンド発生器（１４２）は音声およびロギン
グ監視器（２３０）への認識パラメータ宣言を発し（５
０４）、ｆ）認識コマンド発生器（１４２）は認識リクエストを
発行し（５０６）、ｇ）ＶＭ機能ライブラリ（１３２）のなかの音声メッセ
ージ機能が現在のプロンプトを選択し、句拡張器２３２
へのプロンプト報知を発行し（５０８）、ｈ）句拡張器（２３２）が、ＰＣＭデータバッファ（２
３６）、ＣＯＤＥＣ（２１０）およびＴＩＣ（１８５）
を介して、加入者に現在のプロンプトを発行し、ｉ）認識結果プロセッサ（１４４）が候補結果を検索し
（５１０）、ｋ）認識結果プロセッサ（１４４）は、戻された候補結
果の質を評価し（５１２）、好ましくは認識結果プロセッサ（１４４）は、この評価
の結果を表す値をインタプリタ（１３４）に戻し、ｌ）インタプリタ（１３４）は、認識が反復されるべき
かどうかを決定し（５１４）、ｍ）予め決められた反復カウントが超過されていないか
ぎり、好ましくはステップｇ）のバリエーションととも
に、ステップｆ）〜ｌ）が反復され、反復がカウントさ
れ、ｎ）もし反復カウントが超過された場合には、インタプ
リタ（１３４）はＤＴＭＦ‐ＵＩに移行し、この方法は
終了し、ｏ）もし反復カウントが超過されない場合には、インタ
プリタ（１３４）は認識確認が必要とされるかどうかを
決定し、もし確認が必要とされないならば、この方法は
ステップｒ）により続けられ、もし確認が必要とされる
ならば、この方法はステップｐ）により続けられ、ｐ）インタプリタ（１３４）は、あいまいさレゾリュー
ションＵＩ構造（１４０）のなかの位置またはロケーシ
ョンを選択し、確認ＳＰＡＢ（３００）への参照を認識
コマンド発生器（１４２）に転送し、ｑ）インタプリタ（１３４）は、確認が成功したかどう
かを決定し、もし確認が成功しなかった場合、方法はス
テップｆ）に戻り、もし確認が成功した場合、方法はス
テップｒ）により続けられ、ｒ）インタプリタ（１３４）は、ディジット‐シーケン
スへの最良の候補語ＩＤをマップするマッピング機能に
制御を転送し（５３０）、ｓ）インタプリタ（１３４）は、マップされたディジッ
ト‐シーケンスが音声ＵＩナビゲーション‐オペレーシ
ョンに相当するかどうかを決定し（５３２）、もし肯定
であれば、方法はステップｔ）により続けられ、もし否
定であれば、方法はステップｏ）により続けられ、ｔ）インタプリタ（１３４）は、音声ユーザーインター
フェース内の位置またはロケーションを選択し（５３
４）、方法はステップｗ）により続けられ、ｕ）インタプリタ（１３４）は、マップされたディジッ
ト‐シーケンスに相応する音声メッセージ機能に制御を
転送し（５３６）、ｖ）インタプリタ（１３４）は、通信カウントを更新し
（５３８）、ｗ）インタプリタ（１３４）は、加入者コールが完了し
ているかどうかを決定し（５４０）、もし加入者コール
が完了していれば、方法は終了し、そうでなければ、方
法はステップｃ）で続けられるから成ることを特徴とす
る音声応答メッセージング方法。
【請求項１０】以下のステップ、ａ）確認（ＳＰＡＢ）データを検索し（７００）、ｂ）認識器パラメータを設定し（７０２）、ｃ）現在の確認プロンプトを決定し、確認プロンプト報
知を発信し、ｄ）認識リクエストを発行し、ｅ）認識結果を検索し（７０６）ｆ）検索された候補結果を評価し、ｇ）認識結果が良かったかどうかを評価し、もし認識結
果が良かったならば、方法はステップｈ）により続けら
れ、そうでないならば、方法はステップｋ）により続け
られ、ｈ）成功した確認の状態インディケータを設定し（７１
８）、方法はステップｍ）により続けられ、ｋ）再確認が必要とされるかどうかが決定され（７１
４）、もし再確認が必要ならば、方法は好ましくはステ
ップｄ）により続けられ、もし再確認が必要でないな
ら、方法はステップｌ）により続けられ、ｌ）不成功の確認の状態を設定し（７１６）、ｍ）認識器パラメータを復帰し（７２０）、方法は終了
する、から成ることを特徴とする音声認識結果を確認す
る方法。
【請求項１１】以下のステップ、ａ）候補結果の集合が回復不可能な誤りまたはタイムア
ウト条件が生起したことを指示するかどうかを決定し
（６００）、もし肯定であれば、方法はステップｌ）に
より続けられ、もしそうでなければ、方法はステップ
ｂ）により続けられ、ｂ）（次の）候補結果を選択し（６２０）、ｃ）候補結果を現在の質しきいと比較し（６２２）、ｄ）候補質を決定し（６２４）、ｅ）他の候補結果が考察を必要とするかどうかが決定さ
れ（６２６）、もしそうであれば、方法はステップｂ）
により続けられ、そうでなければ、方法はステップｆ）
により続けられ、ｆ）少なくとも１つの候補結果が良いとして指定されて
いるかどうかが決定され（６３０）、もしそうであれ
ば、方法はステップｋ）により続けられ、そうでなけれ
ば、方法はステップｇ）により続けられ、ｇ）疑わしい候補結果が存在するかどうかが決定され
（６４０）、もしそうであれば、方法はステップｈ）に
より続けられ、そうでなければ、方法はステップｌ）に
より続けられ、ｈ）確認が必要とされる状態のインディケータが設定さ
れ（６４２）、ｉ）良い候補結果の１つが返され、方法は終了する、ｋ）よい結果の状態が設定され（６３８）、方法はステ
ップｉ）により続けられ、ｌ）悪い結果の状態が設定され（６０２）、ｍ）反復カウントをインクリメントし（６０４）、ｎ）予め決められた制限が超過されたかどうかを決定し
（６０６）、もしそうであれば、方法はステップｐ）に
より続けられ、そうでなければ、方法はステップｏ）に
より続けられ、ｏ）反復状態を設定し（６０８）、方法を終了する、ｐ）制限超過状態を設定し（６１０）、方法を終了す
る、好ましくは、ステップｆ）においてｋはｑにより置き換
えられ、ステップｋ）においてｉはｔにより置き換えら
れ、ｑ）多重の良い候補が存在するかどうかが決定され（６
３２）、もしそうであれば、方法はステップｒ）により
続けられ、そうでなければ、方法はステップｋ）により
続けられ、ｒ）各々の良い候補結果の間のスコアの差が検査され
（６３４）、ｓ）差しきいがちょうかされているかどうかが決定され
（６３６）、もしそうであれば、方法はステップｋ）に
より続けられ、そうでなければ、方法はステップｈ）に
より続けられ、ｔ）最良の候補を返し（６１１）、方法は終了する、か
ら成ることを特徴とする音声認識結果を評価する方法。
【請求項１２】ステップｆ）が請求項１１の方法に従
って遂行されることを特徴とする請求項１０記載の方
法。
【請求項１３】以下のステップ、ａ）好ましくは報告パラメータを検索することにより、
報告条件が確立され（１０００）、ｂ）認識−レベルＣＤＲが発生されるべきかどうかが決
定され（１００２）、もしそうであれば、方法はステッ
プｃ）により続けられ、そうでなければ、方法はステッ
プｅ）により続けられ、ｃ）認識結果がモニタされ（１００４）、ｄ）認識統計が発生および／または更新され（１０
６）、ｅ）現在の通信が完了されたかどうかが決定され、もし
そうであれば、方法はステップｆ）により続けられ、そ
うでなければ、方法はステップｂ）により続けられ、ｆ）通信レベルＣＤＲが発生されるべきかどうかが決定
され（１０１０）、もしそうであれば、方法はステップ
ｇ）により続けられ、そうでなければ、方法はステップ
ｈ）により続けられ、ｇ）通信統計が発生され（１０１２）、ｈ）コールが完了されたかどうかが決定され（１０１
６）、もしそうでなければ、方法はステップｂ）により
続けられ、そうであれば、方法はステップｉ）により続
けられ、ｉ）コールレベルＣＤＲが発生されるべきかどうかが決
定され（１０１０）、もしそうであれば、方法はステッ
プｋ）により続けられ、そうでなければ、方法はステッ
プｌ）により続けられ、ｋ）コール統計を発生し（１０１８）、ｌ）各々の必要とされるＣＤＲを発生し（１０２０）、
方法を終了する、から成るカスタマーデータレコードを
生成するための方法であって、カスタマーデータレコー
ドは、好ましくは報告ユニット（１４８）の中で生成さ
れ、その際、報告ユニット（１４８）は、コールの間に
トランスペアレントに作動し、各ＳＰＡＢ（３００）の
なかで指定された報告パラメータに従ってシステム性能
を追跡し、ＣＤＲを発生するべく、インタプリタ（１３
４）、認識コマンド発生器（１４２）および認識結果プ
ロセッサ（１４４）をモニターし、各ＣＤＲの発生のた
めに、コール統計ライブラリ（１５２）のなかの統計の
集合を維持することを特徴とするカスタマーデータレコ
ードを生成するための方法。
【請求項１４】以下のステップ、ａ）発声ロギングが現在のコールの間に必要とされるか
どうかを決定するためのロギングパラメータを検査し
（８００）、もし方法が終了せず、発声ロギングが必要
とされるばらば、方法はステップｂ）により続けられ、ｂ）ロギング条件を確立し（８０２）、ｃ）次の認識事象がログされるべきかどうかが決定され
（８０４）、もしそうでなければ、方法はステップｋ）
により続けられ、もしそうであれば、方法はステップ
ｄ）により続けられ、ｄ）少なくとも１つのサンプリングパラメータの集合を
設定し（８０６）、ｅ）現在の候補結果に対する質評価が完了しているかど
うかを決定し（８０８）、もしそうでなければ、方法は
ステップｅ）により続けられ、もしそうであれば、方法
はステップｆ）により続けられ、ｆ）ロギングパラメータのなかで指定されたどの規範も
適合されているかどうかを決定し（８１０）、もしそう
でなければ、方法はステップｋ）により続けられ、もし
そうであれば、方法はステップｇ）により続けられ、ｇ）発声を蓄積し（８１２）、ｈ）現在のロギングパラメータを検査し、蓄積された発
声がその後の使用のために保持されるべきかどうかを決
定し、もしそうでなければ、方法はステップｋ）により
続けられ、もしそうであれば、方法はステップｉ）によ
り続けられ、ｉ）次の利用可能なロケーションへのロギングバッファ
記憶ロケーション参照を更新し、（８１６）ｋ）現在のコールが完了されているかを決定し、もしそ
うでなければ、方法はステップｃ）により続けられ、も
しそうであれば、方法はステップｌ）により続けられ、ｌ）コールヘッダー情報を発生し（８２０）、ｍ）ロギングデータをデータ蓄積デバイスに転送し（８
２２）、方法は終了する、から成る発声ロギングのための方法において、好ましく
は方法は、ＳＰＡＢ（３００）の群の各々のなかで指定
されたロギングパラメータに従って、発声の選択的なロ
ギングを制御するロギングユニット（１４６）および音
声及びロギング監視器（２３０）によって遂行され、好
ましくは、ロギングユニット（１４６）は、コールの間
にトランスペアレントに作動し、インタプリタ（１３
４）、認識コマンド発生器（１４２）および認識結果プ
ロセッサ（１４４）の作動をモニターし、コールヘッダ
ー情報は、好ましくは、メールボックスＩＤと、可能性
として、カストマーデータレコード（ＣＤＲ）への参照
とを含んでおり、その際カストマーデータレコードは好
ましくは請求項１３の方法により生成されることを特徴
とする発声ロギングのための方法。
【請求項１５】請求項１１の方法および／または請求
項１０または１２の方法および／または請求項１３の方
法を含むことを特徴とする方法。