JPH1188502A - 音声応答メッセージング方法および装置 - Google Patents

音声応答メッセージング方法および装置

Info

Publication number
JPH1188502A
JPH1188502A JP10095390A JP9539098A JPH1188502A JP H1188502 A JPH1188502 A JP H1188502A JP 10095390 A JP10095390 A JP 10095390A JP 9539098 A JP9539098 A JP 9539098A JP H1188502 A JPH1188502 A JP H1188502A
Authority
JP
Japan
Prior art keywords
recognition
voice
logging
interpreter
continued
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10095390A
Other languages
English (en)
Inventor
Hunt Peter
ハント ペーター
Albright Susana
アルブライト スザナー
Graiski Camille
グライスキー カミール
Love Leonard
ラブ レオナード
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Octel Communications Corp
Original Assignee
Octel Communications Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Octel Communications Corp filed Critical Octel Communications Corp
Publication of JPH1188502A publication Critical patent/JPH1188502A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Navigation (AREA)

Abstract

(57)【要約】 【課題】 音声に応答して音声メッセージを送るための
方法であって、音声に応答するVMS(SRVMS)が
加入者にメールボックス、パスワード、ディジットおよ
び(または)ディジットストリングの指定を可能にする
階層構成的に簡単な音声UIを有利な仕方で備えている
方法を提供する。 【解決手段】 それぞれコマンドと発声との間の潜在的
な合致に対応する候補結果の集合を発生する過程と、複
数個の質しきいに従って候補結果の質を評価する過程
と、候補結果評価の質に従って音声ユーザーインタフェ
ース‐ナビゲーションオペレーションおよび音声メッセ
ージオペレーションの群からの1つを呼び出す過程とを
含んでいる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声メッセージお
よび音声認識の双方のためのシステムおよび方法に関す
る。一層詳細には、本発明は、音声メッセージ加入者に
より発せられる音声コマンドに応答して音声メッセージ
を送る方法および装置に関する。
【0002】
【従来の技術】音声メッセージシステムは近年よく知ら
れるようになってきた。典型的な音声メッセージシステ
ム(VMS)はデュアルトーン‐多重周波数(DTM
F)、またはタッチトーン、音声メッセージユーザーイ
ンタフェース(UI)を通じて加入者と対話する。加入
者対話の間、VMSは、対応するオペレーションを開始
するべく1つまたはそれ以上のDTMFキーを押すよう
に加入者に要求する音声プロンプトを発する。加入者が
有効なDTMFキーシーケンスを押す場合には、VMS
は特定のオペレーションセットを実行する。
【0003】いくつかの環境のもとで、加入者の注意を
キーパッドに集中させることは加入者にとって不便であ
り、さらには危険であり得る。たとえば加入者が電話を
しながら運転または歩行している無線電話環境では、加
入者がDTMFキーの集合からオプションを選ぶ必要が
あることは、事故または困難な状況を招くおそれがあろ
う。その結果、コマンド、ユーザーインタフェースナビ
ゲーションおよびディジットおよび/またはディジット
ストリングの音声に基づく選択を通じて、VMSとのハ
ンドフリーな対話を行うための手段として、音声を使用
するためのシステムまたは方法が開発されてきた。
【0004】当業者は、従来のDTMF音声メッセージ
UIが、一般にメニューのかなり複雑または大規模な階
層構成を有することを認識するであろう。音声に基づく
VMS対話を行ういくつかのシステムは、単純に従来の
DTMF‐UIと同一または本質的に同一のメニュー階
層構成を有する音声UIを実行する。加入者が運転およ
びVMS対話のような多重のタスクを同時に実行しなけ
ればならない時、優先度が低いほうのタスクの複雑さを
減ずることが非常に重要である。こうして、この仕方で
音声UIを実行するシステムは、VMS対話の複雑さを
減ずるのに役立たないので、望ましくない。
【0005】当業者は音声認識が厳密でないテクノロジ
ーであることを認識するであろう。DTMF信号と対照
的に、音声は制御されておらず、また大幅に変化し得
る。電話環境での音声認識の難しさはさらに増大する。
なぜならば、電話環境は狭い帯域幅、信号処理または変
換の多重ステージおよびかなりのノイズレベルにより特
徴付けられているからである。無線電話環境は特に、た
とえば車両エンジン、付近の通行または群衆のなかの音
声に起因して、ノイズが大きい傾向がある。
【0006】加入者の意図を正しく決定することを容易
にするべく、音声に基づく音声メッセージシステムは高
いレベルの誤り防止および許容度を有し、また意図され
ないオペレーションを開始する確率を有意義に減じなけ
ればならない。すなわち、音声に基づく音声メッセージ
システムは、繰り返される音声認識の誤りが生じそうな
場合に、所望の音声メッセージタスクの集合を成功裡に
完了するための方策を加入者に与えなければならない。
従来の音声に基づく音声メッセージシステムはこれらの
観点の各々で不適当である。
【0007】正しい加入者の意図の認識および加入者の
意図の決定と結び付けられる難しさは、最適なシステム
性能を達成するべく高レベルの支援および保守を必要と
する。特定の音声認識データおよびシステム性能尺度の
アベイラビリティは、この観点で、特にシステム検査お
よび問題解析に対して、非常に有用であり得る。従来の
システムおよび方法は、いつまたどのように音声認識デ
ータおよびシステム性能尺度が蓄積かつ(または)発生
されるかをフレキシブルに制御するための適当な手段を
備えていない。さらに、従来のシステムおよび方法は、
最大に有用な音声認識データ、すなわち実際の現場での
システム使用の間に発生される音声データ、を収集しな
い。従って、従来の欠点を克服する音声応答‐音声メッ
セージシステムおよび方法が必要とされる。
【0008】
【発明が解決しようとする課題】本発明の課題は、音声
応答‐音声メッセージのためのシステムおよび方法であ
って、音声応答VMS(SRVMS)が加入者にメール
ボックス、パスワード、ディジットおよび(または)デ
ィジットストリングの指定を可能にする階層構成的に簡
単な音声UIを有利な仕方で備えているシステムおよび
方法を提供することである。
【0009】
【課題を解決するための手段】この課題は、本発明によ
れば、特許請求の範囲に記載されている方法により解決
される。
【0010】SRVMSのなかで認識コマンド発生器お
よび音声およびロギング監視器が音声認識器のオペレー
ションを制御する。認識結果プロセッサが、語ごとに異
なり得る質しきいの集合に従って、音声認識器により発
生された候補結果の質を評価する。好ましい実施例で
は、認識結果プロセッサは、個々の候補結果が良いか、
疑わしいか、または悪いか、また2つまたはそれ以上の
候補結果が、各々のこのような結果が有効なコマンドで
あり得る有意義な確率に起因して、あいまいであるかど
うかをを決定する。認識結果プロセッサは追加的に最良
の候補結果を識別する。
【0011】質評価の結果に基づいて、インタプリタ
が、音声UI構造、音声メッセージ機能ライブラリおよ
び認識コマンド発生器と共同して、音声UIメニューま
たは音声メッセージ機能の呼び出しを通じてナビゲーシ
ョンを容易にする。もし認識結果プロセッサが、候補結
果が疑問またはあいまいであると決定したならば、イン
タプリタは、あいまいさレゾリューションUI構造およ
び認識コマンド発生器と共同して、最良の候補結果が加
入者が意図したものであるかどうかを加入者に確認を促
す確認オペレーションを開始する。
【0012】反復される音声認識の誤りに応答して、イ
ンタプリタが、DTMF‐UI構造および音声メッセー
ジ機能ライブラリと共同して、DTMF‐UIへの転送
を開始する。DTMF‐UIへの転送は、音声UIがコ
ンテクストのなかにある間に加入者により発せられる予
め定められたDTMF信号の検出に応答しても実行され
る。従って本発明の方法は、信頼性のあるバックアップ
UIへの自動的な転送および加入者により選択された転
送の双方を行う。
【0013】もし最良の候補結果が音声メッセージ機能
と合致するならば、インタプリタはディジットシーケン
スへの最良の候補結果のマッピングを開始し、また続い
て、ディジットシーケンスと対応する音声メッセージ機
能へ制御を転送する。本発明は音声UIおよびDTMF
‐UIの双方を備えているので、候補結果のマッピング
は音声UIが継目なしに標準DTMF‐UIと重なり、
またDTMF‐UIに対して最初に書かれた機能を利用
することを許す。また、本発明は、音声UIのコンテキ
ストのなかにとどまりながら、音声UIおよびDTMF
‐UIの同時のアベイラビリティを容易にするのに、こ
のマッピングに頼っている。こうして、音声UIのなか
の特定の位置またはロケーションにおいて、本発明は音
声もしくはDTMF信号を音声UIナビゲーションのた
めの有効な入力として成功裡に処理し得る。
【0014】SRVMSは、こうして加入者の意図を成
功裡に決定するべく高いレベルの誤り許容度および誤り
防止を可能にし、またさらに音声UIの部分と並列に,
または反復される音声認識誤りが生じていそうな状況で
バックアップとして、DTMF‐UIへのアクセスを可
能にする。
【0015】ロギングユニットおよび報告ユニットは、
加入者にトランスペアレントな仕方で音声UIと並列に
作動する。ロギングユニットは加入者発声の選択的なロ
ギングを指令し、また報告ユニットは多重の詳細レベル
でのシステム性能統計を選択的に発生し、また維持す
る。
【0016】本発明は、音声パラメータブロック(SP
AB)のなかに蓄積されている複数個のパラメータを通
じて、音声認識、候補結果の質の評価、発声ロギングお
よび性能報告をフレキシブルに制御する。各々のSPA
Bは好ましくは特定の音声UIメニューに対応してい
る。
【0017】
【実施例】本発明では、用語“加入者”は、音声メー
ル、メッセージ蓄積および転送およびメッセージ分配オ
ペレーションのような音声メッセージサービスへの直接
アクセスを有する特定の電話システムユーザーを指して
いる。用語“非加入者”および“非ユーザー”は、加入
者が非加入者のコールに答えるのに失敗する場合に、た
とえばページングダイアログに入り、または音声メッセ
ージをやめることにより、加入者に接触する能力のほか
には、音声メッセージサービスへの直接アクセスを有し
ていない電話システムユーザーを指している。用語“移
動加入者”および“移動非加入者”は移動電話ユーザー
またはセルラ電話ユーザーに対して類似に定義されてい
る。
【0018】いま図1を参照すると、音声応答‐音声メ
ッセージシステム(SRVMS)を使用する典型的な音
声メッセージ(VM)環境のブロック図が示されてい
る。典型的な音声メッセージ環境のなかで、SRVMS
10は報告システム12に接続されている。追加的に、
中央局(CO)スイッチ20は、加入者電話30の集
合、非加入者電話40の集合、公衆交換電話網(PST
N)50およびSRVMS10を接続する。PSTN5
0はさらにセルラ電話システムサービスエリア60のな
かの移動電話交換局(MTSO)70に接続されてい
る。MTSO70は、1つまたはそれ以上の移動加入者
電話90および移動非加入者電話92への電話サービス
を行うべく、セルラ無線設備80の集合と情報を交換す
る。SRVMS10を例外として、図1中に示されてい
る要素およびそれらの接続は好ましくは従来通常のもの
である。
【0019】当業者は図1の典型的な音声メッセージ環
境に多くの変更が行われ得ることを認識するであろう。
たとえば、MTSO70は、PSTN50を通じてでは
なく、直接にCOスイッチ20に接続され得よう。また
セルラ電話に向けられている要素は衛星電話を表す要素
により置換され得よう。図1中に示されている音声メッ
セージ環境は理解を助けるのに有用なものがあり、本発
明の応用可能な範囲を限定しない。
【0020】SRVMS10は音声ユーザーインタフェ
ース(UI)を提供し、それを通じて加入者はVMサー
ビスオプションを選択するべく1つまたはそれ以上のメ
ニューを通じて言葉によりナビゲートし得る。当業者は
従来、特定のSRVMS機能の提供が移動および(また
は)非移動加入者の1つまたはそれ以上の特定の部分集
合に制限され得ることを理解するであろう。任意の所与
のメニューのコンテキストのなかの特定のコマンド語ま
たは句の加入者による発声に応答して、SRVMS10
は対応する音声メッセージサービスを呼び出す。
【0021】いま図2を参照すると、加入者に提供する
音声UIメニューオプションの好ましい最小の集合を示
すフロ−チャートが示されている。図2中に示されてい
る各メニューに対して、SRVMS10は加入者に音声
プロンプトを発する。好ましくは、音声プロンプトはタ
ーゲットコマンド語または句のリスト特定し、またオプ
ションにより、各ターゲットコマンド語または句が対応
する追加的な記述もしくは音声メッセージサービスを特
定する。図2中に示されているように、音声UIメニュ
ーオプションの好ましい最小の集合は、加入者のメール
ボックス番号のエントリのためのメニューと、加入者の
パスワードのエントリのためのメニューと、それから管
理オペレーションまたはメッセージレビューメニューが
選択され得る主メニューと、メッセージレビューメニュ
ー自体とを含んでいる。追加的に、音声UIメニューオ
プションの最小の集合は、特定のオペレーションをスキ
ップし、取消し、または確認するのためのサブメニュー
を提供する。当業者は、追加的なメニューおよび(また
は)サブメニューもメニューまたはサブメニューオプシ
ョンも提供され得ることを認識するであろう。たとえ
ば、当業者により容易に理解される仕方で、メニューは
メッセージを送り、メッセージに答え、またはメッセー
ジを転送するオプションを加入者に提供するべく追加さ
れ得ようし、またはメニューは取消オペレーションを支
援するべく追加され得ようことを認識するであろう。好
ましくは、それを通じて加入者がナビゲートしなければ
ならないメニューおよびサブメニューの全数は、使い易
さを促進するのに合理的な数に保たれている。典型的な
音声プロンプトは“メールボックス番号プリーズ”、
“パスワードプリーズ”および“”主メニュー:選択は
レビュー、チェインジグリーティング、チェインジパス
ワードおよびハングアップです”を含んでいる。高レベ
ルの意味を運ぶ短い音声プロンプトは、好ましくは、加
入者とSRVMS10との間の対話の速度の最大化を助
けるべく各音声UIメニューのなかで利用される。
【0022】好ましい実施例では、音声UIは、最小数
の音声UIメニューを通じてのナビゲーションが音声メ
ッセージオペレーションのほとんどの共通の集合にアク
セスするのに必要とされるように設計されている。標準
のDTMF‐UIと対照的に、音声UIは好ましくはよ
り多くのコマンドを特定のメニューのなかに組み入れて
おり、その結果としてDTMF‐UIよりも少数のメニ
ューとなっている。従って、好ましい音声UIはDTM
F‐UIよりも階層構成的に平らであると言われる。こ
の形式の音声UIは、加入者の“学習曲線”を減じ、ま
た音声UIのなかの特定のコマンドロケーションの記憶
を助けることにより使い易さを増進する。
【0023】SRVMS10は、音声UIを通じての言
葉によるナビゲーションが有用であり得る本質的に任意
のVM環境に応用され得る。たとえば、SRVMS10
は本質的に任意の無線電話システムを含んでいるVM環
境にも、開発途上国でそうかもしれないようにDTMF
サービスが利用可能でないところでも応用され得る。
【0024】システム構成 いま図3を参照すると、本発明に従って構成された音声
応答‐音声メッセージシステム10の好ましい実施例の
ブロック図が示されている。SRVMS10はシステム
制御ユニット100と、ディスクおよび音声I/O制御
ユニット160と、データベースディレクトリエントリ
および各加入者に対するメールボックスが常駐している
データ蓄積ユニット170と、少なくとも1つのディジ
タルラインカード(DLC)180と、電話インタフェ
ースコントローラ(TIC)185と、システムマネー
ジャターミナル(SMT)250とを含んでいる。SR
VMS10の要素は、従来通常の仕方で第1のコントロ
ールバス260および第1のデータバス262を介して
選択的に接続されている。各TIC185は、従来通常
のようにCOスイッチ20に接続されている。好ましい
実施例では、ディスクおよび音声I/O制御ユニット1
60、データ蓄積ユニット170およびSMT250は
従来通常のものである。
【0025】システム制御ユニット100は、SMT2
50を介して受信されるシステムパラメータに従ってS
RVMS10の全体作動を管理する。システム制御ユニ
ット100は、好ましくはバスおよび直接記憶アクセス
(DMA)コントローラ110と、処理ユニット120
と、メモリ130とを含む。このメモリ130内には、
音声メッセージ(VM)機能ライブラリ132、インタ
プリタ134、DTMF UI構造136、音声UI構
造138、およびあいまいさレゾリューションUI構造
140、認識コマンド発生器142、認識結果プロセッ
サ144、ロギングユニット146、報告ユニット14
8、音声パラメータブロックライブラリ150およびコ
ール統計ライブラリ152が常駐している。バスおよび
DMAコントローラ110と、処理ユニット120と、
メモリ130のなかの各要素とは内部バス270を介し
て接続されている。バスおよびDMAコントローラ11
0は、さらに第1のデータおよびコントロールバス26
0、262、SMT250にも報告システム12にも接
続されている。好ましくは、バスおよびDMAコントロ
ーラ110と報告システム12との間に保たれる接続
は、多重プロトコルに従っての転送を許す多重の接続線
を含んでいる。
【0026】DLC180は、音声データをCOスイッ
チ20と交換し、DTMF信号を処理し、システム制御
ユニット100の指令のもとに音声認識およびロギング
オペレーションを実行する。DLC180は、好ましく
はDLCバスコントローラ190、DLC処理ユニット
200、コーダ/デコーダ(CODEC)210および
DLCメモリ220を含んでいる。音声認識器222、
DTMFプロセッサ224、テンプレートライブラリ2
26、ロギングバッファ228、音声およびロギング監
視器230、句拡張器232、自動応答ライブラリ23
4、パルス符号変調(PCM)データバッファ236お
よび信号コンディショナ238は、DLCメモリ220
のなかに常駐している。DLCメモリ220のなかの各
要素は、第2のデータバス280を介してDLCバスコ
ントローラ190およびDLC処理ユニット200に接
続されている。DLCバスコントローラ190は、第2
のコントロールバス282を介してDLC処理ユニット
200に接続されている。追加的に、DLCバスコント
ローラ190は、第1のデータおよびコントロールバス
260、262に接続されている。CODEC210、
句拡張器232、信号コンディショナ238およびDT
MFプロセッサ224は、好ましくは従来通常のもので
ある。CODEC210は、PCMデータバッファ23
6と電話インタフェースコントローラ185との間のD
MA形式のオペレーションを行うべく、PCMデータバ
ッファ236およびDLCバスコントローラ190に接
続されている。
【0027】主要な必要条件および機能能力 成功裡の音声応答VMを提供するためには、いくつかの
主要な互いに関係する必要条件が満足されなければなら
ない。これらの主要な必要条件とそれらの解決がSRV
MS10のなかの個々の要素により容易にされる仕方と
を以下に説明する。
【0028】I.第1の主要な必要条件は、加入者の発
声を検出し、また発声に相当する特定のコマンド語また
は句を識別する能力である。この能力はテンプレートラ
イブラリ226および自動応答ライブラリ234と共に
音声認識器222により与えられる。
【0029】音声認識器222は好ましくは従来通常の
ものであり、また、コマンド語および(または)個別の
ディジットの検出が必要とされる時に離散的な認識モー
ドで、またはディジットストリングの検出が必要とされ
る時に連続的な認識モードで、加入者の発声の非発声者
依存性の認識を行う。音声認識器222は好ましくは、
以下に一層詳細に説明されるように、特定の条件の検出
により認識の試みを自動的に再開する接続された認識モ
ードでも認識を行う。連続的な認識モードにある時、音
声認識器222は個別のディジットの検出を容易にする
べく発声の前準備的な処理を行い得る。好ましい実施例
では、音声認識器222は追加的に発声者依存性または
発声者適応性の音声認識を行い得る。
【0030】テンプレートライブラリ226は、当業者
に容易に理解される仕方で、語テンプレートと、音声認
識器222に対する音声UIのなかの各有効コマンドを
定める対応する語識別(ID)とを記憶する。自動応答
ライブラリ234は、以下に一層詳細に説明されるよう
に、語テンプレートと、音声およびロギング監視器23
0が非依存的に作用する自動応答コマンド語を定める対
応する語IDとを記憶する。
【0031】音声認識器222は、以下に一層詳細に説
明されるように、音声およびロギング監視器230の指
令のもとに認識の試みを開始する。認識の試みの間に、
音声認識器222は、加入者の発声と語彙との間の最も
緊密な合致を決定するべく試みる。ここで、語彙はテン
プレートライブラリ226のなかに記憶されている語テ
ンプレートの部分集合として定義されている。語彙は特
定の音声UIメニューのなかの利用可能なコマンド語ま
たは句に対応する。こうして、語彙は特定の語テンプレ
ートの編成である。認識の試みが完了すると、音声認識
器222は認識結果を音声およびロギング監視器230
に戻す。好ましくは、認識結果は候補結果の集合を含ん
でおり、各々の候補結果は候補語IDと各候補語IDに
対応する少なくとも1つのスコアとを含んでいる。理解
を助けるべく、ここでは単一のスコアが各候補語IDと
結び付けられていると仮定して説明する。予め決定され
た候補結果は、好ましくは、タイムアウト条件、アウト
‐オブ‐ボキャブリ語(OVW)、解明不可能な誤りま
たは他の“合致可能でない”条件の生起を指示するため
に蓄積される。
【0032】さまざまな認識器パラメータが音声認識器
222の作動の仕方を制御する。好ましい実施例では、
実行されるべき認識の形式、タイムアウト情報、最小お
よび最大受容可能なストリング長さ、特定の語彙の参
照、必要とされる候補結果の数およびスコア制御情報が
認識器パラメータにより指定され得る。
【0033】II.第2の主要な必要条件は音声認識器
222を制御するための適切な構造のコマンドを発する
能力である。これは認識コマンド発生器142および音
声およびロギング監視器230を通じて容易にされてい
る。インタプリタ134により発せられるコールに応答
して、認識コマンド発生器142が音声およびロギング
監視器230に認識パラメータ宣言を発する。好ましく
は、認識パラメータ宣言は先に説明された認識器パラメ
ータを指定する。認識パラメータ宣言に応答して、音声
およびロギング監視器230が音声認識器222を初期
化する。
【0034】認識コマンド発生器142は追加的に音声
およびロギング監視器230に認識リクエストを発す
る。認識リクエストを受信すると、音声およびロギング
監視器230は音声認識器222に認識の試みを開始す
るべく指令する。音声およびロギング監視器230は追
加的に、特定のDTMF信号およびハング‐アップ条件
の生起が検出され得るように、DTMFプロセッサのオ
ペレーションを開始させる。
【0035】音声認識器222が候補結果の集合を発生
した後に(またはDTMFプロセッサ224が結果を発
生した後に)、音声およびロギング監視器230が自動
応答オペレーションを実行し、もしくは候補結果の集合
を制御ユニットメモリ130に転送し、また結果処理オ
ペレーションを開始するべくインタプリタ134に値を
戻す。認識コマンド発生器により認識リクエストが発せ
られることにより開始し、インタプリタ134に値が戻
されることにより終了する事象のシーケンスは、ここで
は認識事象を呼ばれている。
【0036】好ましい実施例では、音声およびロギング
監視器230は、音声認識器222が自動応答ライブラ
リ234のなかに記憶されている特定の自動応答コマン
ド語を検出している場合には、自動応答オペレーション
を実行する。好ましくは、自動応答語は“より速い”、
“より遅い”、“より強い”および“より弱い”を含ん
でいる。音声およびロギング監視器230は検出された
自動応答コマンド語に対応するオペレーションの集合を
実行する。“より速い”または“より遅い”の検出はそ
れぞれより速いまたはより遅いメッセージプレイバック
を結果として生じ、また“より強い”または“より弱
い”の検出はそれぞれボリューム増大または減少を結果
として生ずる。音声およびロギング監視器230はまた
特定の誤り条件の検出に応答して自動応答オペレーショ
ンを実行し得る。自動応答オペレーションは、好ましく
は、接続されている認識モードを介してイネーブルされ
る。自動応答オペレーションを実行した後、音声および
ロギング監視器230は最も新しい認識リクエストに従
って他の認識の試みを開始する。
【0037】III.成功裡の音声応答VMを提供する
ための第3の主要な必要条件は候補結果の質を解析また
は評価する能力である。この能力は認識結果プロセッサ
144を通じて容易にされる。認識事象の完了に続い
て、認識結果プロセッサ144は候補結果が良いか、悪
いか、疑わしいかを決定する。認識結果プロセッサ14
4により実行される詳細なオペレーションは図6を参照
して後で説明される。
【0038】IV.成功裡の音声応答VMを提供するた
めの第4の主要な必要条件は、音声UIのどの部分が任
意の時点で加入者に与えられるかを制御し、また音声U
Iの1つの部分から他の部分への選択的に移行し、また
は認識結果プロセッサ144により実行される評価の結
果に基づいて音声メッセージ機能を呼び出す能力であ
る。この能力はインタプリタ134、音声UI構造13
8およびVM機能ライブラリ132を通じて容易にされ
る。
【0039】好ましい実施例では、各UI構造136、
138、140は、UIナビゲーションオペレーション
もしくはVM機能を実行するプログラム命令のシーケン
スへの参照を階層的に編成するデータ構造を含んでい
る。各々のこのようなプログラム命令シーケンスは好ま
しくはVM機能ライブラリ132のなかに記憶されてい
る。上記の階層的な編成は加入者に利用可能なメニュー
およびサブメニューに対応する。好ましい実施例では、
各UI構造136、138、140はツリーから成って
いる。
【0040】音声UIを実行するため、インタプリタ1
34は音声UI構造136のなかの位置またはロケーシ
ョンへの参照を選択または維持する。音声UI構造13
6のなかの現在のロケーションと、音声およびロギング
監視器230により戻された値と、認識結果プロセッサ
の候補結果集合評価の結果とに基づいて、インタプリタ
134がVM機能ライブラリ132のなかの適切なプロ
グラム命令シーケンスへの制御転送を指令する。好まし
い実施例では、インタプリタ134は事象駆動ケース形
式のステートメントを介して制御転送を開始する。VM
機能の実行中に頂点に達する認識事象はここでは通信と
呼ばれている。
【0041】本発明では、特定のUIはインタプリタ1
34と、所与のUI構造136、138、140と、所
与のUI構造136、138、140により参照されて
いるVM機能ライブラリ132のなかのプログラム命令
シーケンスの集合とを使用して実行される。こうして、
音声UI構造136と、インタプリタ134と、VM機
能の特定の群とは共同して本発明の音声UIを実行す
る。同様に、DTMFUI構造136はインタプリタ1
34およびVM機能ライブラリ132と共に、好ましい
実施例では音声メッセージ‐ユーザーインタフェース‐
フォーラム(VMUIF)標準に従って定義されている
DTMF‐UIを実行する。あいまいさレゾリューショ
ンUI構造140は、インタプリタ134およびVM機
能ライブラリ132の部分とならんで、音声UIのなか
の確認メニューを実行し、それを通じて加入者は、図7
を参照して後で詳細に説明されるように、依然の応答を
確認するように促される。
【0042】当業者は各UIがスレッディッド‐コード
技術、特にForthまたはJavaのようなプログラ
ム言語のコンテキストのなかで一般的に定義されている
スレッディッド‐コード技術、に従って実行されること
を理解するであろう。任意の他のUIが当業者により容
易に理解されるような仕方で実行され得ようが、上記の
ようなUIの実行は、その結果として、異なるシステム
形式を横断しての移植性を高め、オペレーションを速く
し、記憶要求を減じ、またより簡単なシステム開発オペ
レーション試験を容易にする。
【0043】V.成功裡の音声応答VMを提供するため
の第5の主要な必要条件は、音声UIと並列に利用可能
なDTMF‐UIの1つまたはそれ以上の部分を有する
能力と、認識誤りが反復して生じそうな状況のもとでバ
ックアップとしてDTMF‐UIに頼る能力とである。
この必要条件はインタプリタ134、VM機能ライブラ
リ132およびDTMF‐UI構造136により満足さ
れる。音声UIと並列に利用可能なDTMF‐UIを有
することは加入者入力の処理を、このような入力が音声
であるかDTMF信号であるかにかかわりなく、容易に
する。この同時のUIの用意は、a)メールボックス番
号またはパスワードの加入者エントリが必要とされる時
のように、音声もしくはDTMF信号を処理し、また音
声UIのコンテキストのなかにとどまることが望ましい
状況、およびb)特定のDTMF入力の受信に応答して
の音声UIからDTMF‐UIへ転送することが望まし
い状況に備える。
【0044】音声UIへのバックアップとして役立つD
TMF‐UIの存在はSRVMS10を、音声がUIナ
ビゲーションのための唯一の入力手段であるシステムよ
りも一層信頼性に富むものとする。音声認識に終始問題
がある状況のもとで、DTMF‐UIは加入者にそのV
Mタスクの成功裡の完了を可能にする。
【0045】当業者は、DTMF‐UIへの転送が、D
TMFへのロータリ信号をマップするために利用可能な
ロータリダイヤリング検出およびマッピング機能が利用
可能でないかぎり、DTMFが利用可能である電話環境
のなかでしか実行可能でないことを認識するであろう。
このような機能はたとえばラインカードに常駐している
ハードウェアおよび(または)ソフトウェアにより与え
られ得よう。当業者は、ロータリダイヤリングによる情
報のエントリにはかなりの時間がかかり得るので、非D
TMF環境のなかに音声UIを用意することが望ましい
ことであり得ることを認識するであろう。
【0046】VI.成功裡の音声応答VMを提供するた
めの第6の主要な必要条件は、加入者への選択的に割込
み可能なプロンプトおよびメッセージの発信を制御する
能力である。これはインタプリタ134と、UI構造1
36、138、140と、VM機能ライブラリ132の
なかの少なくとも1つのVM機能と、句拡張器232と
により容易にされている。好ましい実施例では、句拡張
器232はDTMFプロセッサ224および音声および
ロギング監視器230により発せられる信号に応答し、
また、DTMF信号が検出されるまで、または音声およ
びロギング監視器230が認識結果を認識結果プロセッ
サ144に戻すまで、プロンプトまたはメッセージを行
う。追加的に、プロンプトは、音声認識器222が(デ
ィジット‐ストリングの開始のような)認識可能な発声
の開始を検出する時には、より早い時点で停止され得
る。この能力はここで“バージ‐イン(barge‐i
n)”と呼ばれており、また割込みコードの集合に従っ
て選択的に実行される。音声プロンプトまたはメッセー
ジ割込みが可能にされていることは加入者とSRVMS
10との間の対話の速度の最大化を助ける。好ましい実
施例では、認識結果は自動応答オペレーションの後に認
識結果プロセッサ144に戻されず、従ってまたプロン
プトが自動応答オペレーションの間および後に行われ続
ける。
【0047】VII.成功裡の音声応答VMを提供する
ための第7の主要な必要条件は、SRVMS性能情報を
選択的に発生しかつ解析する能力である。これはロギン
グユニット146、報告ユニット148および音声およ
びロギング監視器230により容易にされている。SR
VMS性能情報の発生および解析は、問題を識別し、ま
たシステムが使用される仕方を追跡するために特に有用
である。ロギングユニット146および報告ユニット1
48により行われる詳細なオペレーションは図8ないし
図10を参照して後で説明される。
【0048】制御パラメータ 本発明は、音声認識事象の開始、評価、ロギングおよび
報告を制御するためのさまざまなパラメータに頼ってい
る。音声UIのなかの各メニューに対して、SPABラ
イブラリ150のなかの対応するSPAB300がこれ
らのパラメータを記憶する。いま図4Aを参照すると、
SPAB300の好ましい実施例のブロック図が示され
ている。各SPAB300は好ましくは、ロギングおよ
び報告パラメータのリストを記憶するための第1のデー
タフィールド302と、音声認識制御パラメータのリス
トと前記の割込みコードとを記憶するための第2のデー
タフィールド304と、後で詳細に説明される質しきい
のリストを記憶するための第3のデータフィールド30
6と、音声メッセージ機能へ語IDをマップするために
使用されるディジット‐マッピング‐リストを記憶する
ための第4のデータフィールド308と、語彙モジュー
ルへの参照のリストを記憶するための第5のデータフィ
ールド310とを含んでいるデータ構造である。
【0049】ロギングパラメータは、ロギングユニット
が加入者の発声のロギングを指令する仕方を指定し、ま
た好ましくは下記を選択的に指定する条件コードを含ん
でいる: ・ロギングがコール‐レベル、通信レベルまたは認識事
象レベルにおいて擬似ランダムであり、(決してないに
対する1000あたり0からいつもに対する1000あ
たり1000までの範囲に及ぶ)それぞれ通信または認
識事象の1000コールあたり特定の数に関して選択可
能であるかどうか;SRVMSポート番号; ・1つまたはそれ以上の加入者メールボックス; ・音声UIのなかの1つまたはそれ以上のメニュー; ・特定の語ID; ・ロギングが生起すべき認識形式; ・良い認識をログすべきかどうか; ・悪い認識をログすべきかどうか; ・疑わしい語または混乱した語対をログすべきかどう
か; ・コマンドまたはディジットをログすべきかどうか; ・ログされるべき特定の誤りまたはOVW条件;、およ
び ・サンプリングパラメータ。
【0050】サンプリングパラメータは音声およびロギ
ング監視器230により使用され、またロギングが生の
音声に対して生起すべきか、前処理された(すなわちエ
コーを消去された)音声に対して生起すべきかどうか
と、音声認識の間のどの点においてロギングがが開始し
また終了すべきかを指示するタイミング定義とを指定す
る。ロギングユニット146により実行される詳細なオ
ペレーションは図8、図9Aおよび図9Bを参照して後
で説明される。
【0051】報告パラメータは報告ユニット148が作
動する仕方を制御し、また、好ましくは、報告が生起す
べきかどうかと、報告が認識あたりベースで実行される
べきか、通信あたりベースで実行されるべきか、または
コールあたりベースで実行されるべきかを指示する制御
条件とを指定する。報告ユニット148により実行され
る詳細なオペレーションは図10を参照して後で説明さ
れる。
【0052】音声認識パラメータは音声認識器に対する
初期化および認識設定を指定する。好ましい実施例で
は、音声認識パラメータは、実行されるべき認識の形
式、タイムアウト情報、最小および最大の受容可能なス
トリング長さ、特定の語彙への参照、必要とされる候補
結果の数、スコア制御情報および誤り制御情報を指示す
る。
【0053】いま図4Bをも参照すると、語彙モジュー
ル320の好ましい実施例のブロック図が示されてい
る。各語彙モジュール320は、語IDのリストを記憶
するための第1のデータフィールド322と、各語ID
に対応する語または句を記憶するための第2のデータフ
ィールド324とを含んでいるデータ構造である。任意
の与えられた語彙モジュール320は、音声UIの特定
のメニューのなかの加入者に利用可能なコマンド語また
は句を指定する。好ましい実施例では、SPAB300
の集まりがSRVMS10により支援される各言語に対
して存在している。
【0054】実施例の詳細 好ましい実施例では、インタプリタ134、認識コマン
ド発生器142、認識結果プロセッサ144、ロギング
ユニット146および方向ユニット148の各々は、処
理ユニット120により実行可能であり、またメモリ1
30のなかに記憶されている一連のプログラム命令シー
ケンスを含んでいる。同様に、音声認識器222、DT
MFプロセッサ224、音声およびロギング監視器23
0、句拡張器232および信号コンディショナ238の
各々は、DLC処理ユニット200により実行可能であ
り、またDLCメモリ220のなかに記憶されているプ
ログラム命令シーケンスを含んでいる。DLC処理ユニ
ット200は好ましくは市販品として入手可能なディジ
タル信号プロセッサ(DSP)により実行されている。
当業者は、前記の要素の1つまたはそれ以上の部分がそ
の代わりに代替的な実施例のなかでハードウェアとして
実現されていてよいことを認識し、またDLC処理ユニ
ット200がDSPでなくてもよいことを理解するであ
ろう(たとえばPentinumプロセッサ(インテル
社、サンタクララ、CA)が使用され得よう)。
【0055】典型的な実施例では、SRVMS10はシ
ステムコントローラメモリ130およびDLCメモリ2
20のなかに示されている要素と、DLCバスコントロ
ーラ190としての役割をする80486マイクロプロ
セッサ(インテル社、サンタクララ、CA)と、Tex
as Instruments C31DSP(Tex
as Instruments社、ダラス、TX)と、
高移植性認識器ライブラリ(PRL)ソフトウェア(V
oice Processing社、ケンブリッジ、M
A)と、通常のX.25カップリングおよびスモールコ
ンピュータシステムインタフェース(SCSI)バスを
介してバスおよびDMAコントローラ110に接続され
ているPentinumまたは類似のプロセッサを有す
るパーソナルコンピュータとを有するOctel Si
eraシステム(Octel Communicati
on社、ミルピタス、CA)である。代替的な実施例で
は、SRVMS10は“集積された音声メッセージを有
する電子メールシステム”という名称の米国特許第 5,5
57,659号明細書に記載されているもののような統合また
は集積された音声メッセージシステムのなかで実現され
得よう。このような実施例では、図3中に示されている
SRVMS10の要素は、当業者により容易に理解され
る仕方で、電子メールシステムに接続されている音声サ
ーバーのなかに常駐している。
【0056】当業者は追加的に、、さらに他の実施例の
なかでSRVMS10が単一プロセッサシステムのなか
で実現され得ることを認識するであろう。このような実
施例には、DLC処理ユニット200は存在しておらず
(または等価的に、DLC処理ユニット200および処
理ユニット120は1つの同じ要素であり)、また図1
のDLCメモリ220のなかの要素222、224、2
26、228、230、232、234、235、23
8はその代わりに、TIC185からのDMA形式の転
送が必要とされる場合のCODEC210を例外とし
て、制御ユニットメモリ130のなかで実現されてい
る。
【0057】詳細な作動 前記のシステム要素が本質的に継目のない仕方で音声応
答VMを実行するべく順次にかつ(または)並列に相互
作用する仕方は図5ないし図10を参照して詳細に説明
される。
【0058】いま図5を参照すると、本発明による音声
応答‐音声メッセージのための好ましい方法のフロ−チ
ャートが示されている。好ましい実施例では、図5で実
行される作動は、インタプリタ134がDLCバスコン
トローラから受信された到来コール報知に応答して最初
のSPAB300への参照を認識コマンド発生器142
に転送する時に開始される。
【0059】好ましい方法は認識コマンド発生器142
が考察のために最初のSPAB300を選択するステッ
プ500で開始する。好ましい実施例では、最初のSP
AB300はメールボックス番号エントリメニューに対
応する。当業者は、最初のSPAB300が加入者への
音声UIとDTMF‐UIとの間の選択の提供を容易に
し得るウェルカムメニューのようないくつかの他のメニ
ューに対応し得ることを認識するであろう。次に、認識
コマンド発生器142がステップ502で現在の選択さ
れたSPAB300のなかの認識器パラメータを検索
し、またステップ504で音声およびロギング監視器2
30への認識パラメータ宣言を発する。それに従って、
続いて音声およびロギング監視器230は音声認識器2
22を初期化する。次いで、ステップ506で、認識コ
マンド発生器142が認識リクエストを発し、それによ
り認識事象を開始する。ステップ506の後に、VM機
能ライブラリ132のなかの音声メッセージ機能が現在
のプロンプトを選択し、またステップ508で句拡張器
232へのプロンプト報知を発する。続いて、句拡張器
232が従来通常の仕方で、すなわちPCMデータバッ
ファ236、CODEC210およびTIC185を介
して、加入者に現在のプロンプトを発する。プロンプト
は好ましくは、DTMF信号が検出されるまで、または
音声およびロギング監視器230が候補結果の集合を制
御ユニット100に戻すまで発せられる。
【0060】ステップ508に続いて、認識結果プロセ
ッサ144がステップ510で候補結果の集合を検索す
る。好ましい実施例では、インタプリタ134が、候補
結果の集合が評価を必要とすることを示す値を音声およ
びロギング監視器が戻すのに応答して、認識結果プロセ
ッサ144への制御転送を開始する。認識結果プロセッ
サ144は続いて、図6を参照して後で詳細に説明され
るように、ステップ512で戻された候補結果の質を評
価し、また好ましくはこの評価の結果を指示する値をイ
ンタプリタ134に戻す。
【0061】認識結果プロセッサ144から受信された
値に基づいて、インタプリタ134が、認識がステップ
514で反復されるべきかどうかを決定する。もし認識
結果プロセッサの評価の結果が、加入者の応答が悪かっ
たことを指示し、かつ認識反復カウントが超過されてい
ないならば、認識が反復されなければならない。悪い応
答は、おそらくたとえば過大な背景音から生ずる期待さ
れた語ではないなんらかの意味を表す可聴事象に起因し
得よう。認識が反復されなければならない場合に、好ま
しい方法は他の認識事象を開始するべくステップ506
に戻ることである。好ましい実施例では、ステップ50
8で発せられる現在のプロンプトは認識が反復された回
数に従って変化し得る。
【0062】加入者の応答が悪く、かつ反復カウントが
超過された場合には、インタプリタ134はステップ5
16および518を介してDTMF‐UIに移行する。
ステップ518の後に、この好ましい方法は終了する。
【0063】もし認識反復もDTMF‐UIへの転送も
必要とされないならば、インタプリタ134は、認識確
認がステップ520で必要とされるかどうかを決定す
る。本発明では、確認は評価の結果が疑わしい応答また
はあいまいな応答を指示する時に必要とされる。もし確
認が必要とされるならば、インタプリタ134はあいま
いさレゾリューションUI構造140のなかの位置また
はロケーションを選択し、また、図7を参照して後で詳
細に説明されるように確認オペレーションを開始するべ
く、ステップ522で確認SPAB300への参照を認
識コマンド発生器142に転送する。ステップ522の
後に、インタプリタはステップ524で確認が成功裡で
あったかどうかを決定する。もし否定であれば、この好
ましい方法はステップ506に戻る。
【0064】確認がステップ520で必要とされない
時、またはステップ524での成功裡の確認の後に、イ
ンタプリタ134はステップ530でディジット‐シー
ケンスへの最良の候補語IDをマップするマッピング機
能に制御を転送する。マッピング機能はマッピング‐オ
ペレーションを実行するのに現在のSPAB300のな
かのデータ頼っている。インタプリタ134は続いてス
テップ532で、マップされたディジット‐シーケンス
が音声UIナビゲーション‐オペレーションに相当する
かどうかを決定する。もし肯定であれば、インタプリタ
134はステップ534で音声UIのなかの位置または
ロケーションを選択する。音声UIナビゲーションでは
なくVM機能が必要とされる場合には、インタプリタは
ステップ536で、マップされたディジット‐シーケン
スに相当するVM機能に制御を転送する。好ましい実施
例では、ディジット‐シーケンスはシングル‐エンティ
ティとして解釈されている。
【0065】メッセージ‐プレーバックを指令するVM
機能は、メッセージが加入者に送られている間に加入者
の発声の認識および評価が選択的に実行されるように、
認識コマンド発生器142および認識結果プロセッサ1
44と共同して作動する。このことはまたSRVMS1
0と加入者との間の相互作用速度の最大化を助ける。
【0066】ステップ536の後に、インタプリタ13
4はステップ538で通信カウントを更新する。ここ
で、通信は音声メッセージ機能の実行に最高潮に達する
音声UIと加入者との成功裡の相互作用として定義され
ている。通信カウントは、図10を参照して詳細に説明
されるように、方向ユニット148により選択的に利用
される。
【0067】当業者はステップ530で発生されるディ
ジット‐シーケンスが、加入者がDTMF‐UIと相互
作用したものと同一の音声メッセージサービスをリクエ
ストするであろうDTMFコマンドのシーケンスに相当
することを理解するであろう。こうして、ステップ53
0で実行されるマッピングは、SRVMS10がDTM
Fのみのシステムで音声メッセージ機能を実行するため
に最初に書かれた1つまたはそれ以上のプログラム命令
シーケンスを直接に使用することを許す。こうして、本
発明により提供される音声UIは従来通常のDTMF‐
UIを部分的または完全にカバーし、可能性としてシス
テムの信頼性を高め、かつ(または)システムの開発時
間を短縮する。さらに、本発明により提供される音声U
Iは2つまたはそれ以上の非同一のDTMF‐UIを継
目なしにカバーし得る。
【0068】ステップ534または538の後に、イン
タプリタ134はステップ540で加入者のコールが完
了しているかどうかを決定する。もし肯定であれば、こ
の好ましい方法は終了する。さもなければ、この好まし
い方法はステップ500へ進み、そこでインタプリタ1
34は考察のために適切なSPAB500を選択する。
コール完了は好ましくは、DTMFプロセッサ224が
ハングアップ条件を検出する時、または“ハング アッ
プ”のようなコマンド語または句が成功裡に検出または
処理される時に指示される。
【0069】好ましい実施例では、語“ヘルプ”の成功
裡の認識はインタプリタ134をして対応するヘルプS
PAB300の選択を介して音声UIのなかの特定のヘ
ルプメニューに移行させる。好ましくは、主音声UIメ
ニューからのコンテキスト感受性のユーザー‐アシスタ
ンスの実行を容易にするべく、さまざまなヘルプSPA
B300が存在する。特定のヘルプSPAB300のイ
ンタプリタの選択はこうして、加入者がヘルプをリクエ
ストした音声UIのなかの位置またはロケーションに基
づいている。
【0070】いま図6を参照すると、音声認識結果を評
価するための好ましい方法(図5のステップ510およ
び図7のステップ710)のフロ−チャートが示されて
いる。この好ましい方法はステップ600で、認識結果
プロセッサ144が候補結果の集合が回復不可能な誤り
またはタイムアウト条件が生起したことを指示するかど
うかを決定する。もし肯定であれば、認識結果プロセッ
サ144はステップ602で悪い結果の状態インディケ
ータを設定し、またステップ604で反復カウントをイ
ンクレメントする。確認結果の質を評価する時、認識結
果プロセッサ144は確認反復カウントをインクレメン
トし、さもなければ、認識結果プロセッサ144は認識
反復カウントをインクレメントする。もし適当な反復カ
ウント制限が超過されているならば、認識結果プロセッ
サ144はステップ606および610を介して対応す
る制限超過を設定する。適当な反復カウント制限が超過
されていない場合には、認識結果プロセッサ144はス
テップ608で反復状態インディケータを設定する。ス
テップ608もしくは610の後に、この好ましい方法
は終了する。
【0071】もし誤りまたはタイムアウトが生起しなか
ったならば、認識結果プロセッサ144はステップ62
0で第1の候補結果を選択する。認識結果プロセッサ1
44は次いでステップ620で、選択された候補結果の
なかのスコアを選択された候補結果の語IDに対応する
しきいスコアの群と比較する。好ましくは、記憶されて
いる音声UIメニューのなかの各々の有効な語IDに対
するしきいスコアは現在のSPAB300のなかに記憶
される。好ましい実施例では、第1のしきいスコアは、
それよりも上では候補結果が“良い”とみなされる第1
の質レベルを確立する。第2のしきいスコアは、それよ
りも下では候補結果が“悪い”とみなされる第2の質レ
ベルを確立する。第1の質レベルと第2の質レベルとの
間では、候補結果は“疑わしい”とみなされる。当業者
は代替的な実施例で“非常に良い”のような追加的な質
しきいが定義され得ることを認識するであろう。当業者
は、音声認識器が単一の候補語IDに対して多重の形式
のスコアを戻す実施例では、別々の形式のしきいスコア
が類似に定義され得ることを認識するであろう。代替的
な実施例では、認識結果プロセッサ144は質評価を助
けるべく統計的言語モデリングを追加的に実行する。
【0072】ステップ622の後で、認識結果プロセッ
サ144はステップ624でその質指定に従って現在選
定された候補結果をマークする。認識結果プロセッサ1
44は次いで、ステップ626で他の候補結果が考察を
必要とするかどうかを決定する。もし肯定であれば、こ
の好ましい方法はステップ620に戻る。
【0073】いったん各候補結果が考察され終わると、
認識結果プロセッサ144はステップ630で少なくと
も1つの候補結果が“良い”として指定されているかど
うかを決定する。もし肯定であれば、認識結果プロセッ
サ144はステップ632で、多重の良い候補結果が存
在しているかどうかを決定する。もしただ1つの候補結
果が“良い”として指定されているならば、認識結果プ
ロセッサ144はステップ638で良い結果の状態イン
ディケータを設定し、またステップ644でこの候補結
果に戻り、その後にこの好ましい方法は終了する。
【0074】多重の良い候補結果が存在している時に
は、認識結果プロセッサ144はステップ634で各々
の良い候補結果の間のスコアの差を検査し、またステッ
プ636で最小のスコア差しきいが超過されているかど
うかを決定する。もし最小のスコア差しきいが超過され
ているならば、認識結果プロセッサ144はステップ6
28で良い結果の状態インディケータを設定し、またス
テップ644でこの候補結果に戻り、その後にこの好ま
しい方法は終了する。好ましい実施例では、最良の候補
結果は、もし最小スコア差しきいが超過されるとすれ
ば、(語IDと結び付けられたスコアにより指示される
ような)最小不確かさの良い候補結果として定義されて
いる。もし最小のスコア差しきいが超過されていないな
らば、認識結果プロセッサ144はステップ642で確
認が必要とされる状態に戻り、その後にこの好ましい方
法はステップ644に進む。こうして、本発明は、あい
まいではあっても良い可能性のある認識結果を加入者の
確認を要請して発生することを保証する。
【0075】ステップ630で良い候補結果が存在して
いない場合には、認識結果プロセッサ144はステップ
640で疑わしい候補が存在しているかどうかを決定す
る。もし肯定であれば、この好ましい方法はステップ6
42に進む。さもなければ、この好ましい方法はステッ
プ602に進む。好ましい実施例では、認識結果プロセ
ッサ144は、ストリングのなかの任意の所与の数の質
または有効性が決定されるように、ディジット‐ストリ
ングに対応すると期待される候補結果を評価する。
【0076】いま図7を参照すると、音声認識結果を確
認するための好ましい方法(図5のステップ540)の
フロ−チャートが示されている。この好ましい方法は、
認識コマンド発生器142が確認SPAB300のなか
のデータを検索するステップ700で開始する。次に、
認識コマンド発生器142が音声およびロギング監視器
230に、確認SPAB300のなかで指示されるよう
な認識器パラメータを設定する認識パラメータ宣言を発
する。
【0077】音声メッセージ機能は次いでステップ70
4で現在の確認プロンプトを決定し、また句拡張器23
2に確認プロンプト報知を発する。好ましくは、加入者
がプロンプトの間に最良の語または句候補を与えられる
ように、確認プロンプト報知は現在の確認プロンプトに
確認を必要とする語または句の語IDを加えたものへの
参照を含んでいる。たとえば、もし語“レビュー”が確
認を必要としたならば、現在の確認プロンプトに疑問の
ある語IDを加えたものが“レビューと言いましたか?
イエスかノーで答えて下さい”というような仕方で加
入者に与えられるであろう。句拡張器232は当業者に
より容易に理解される仕方で加入者に現在の確認プロン
プトおよび考察されている語を発する。好ましい実施例
では、確認プロンプトの割込みは許されていない。
【0078】ステップ704に続いて、認識コマンド発
生器142は認識リクエストを発し、それによりステッ
プ706で認識事象を開始する。音声およびロギング監
視器230は好ましくは制御ユニットメモリ130に確
認のために候補結果を戻し、また質評価が必要とされる
ことを指示する値をインタプリタに戻す。インタプリタ
134はそれに応答して認識結果プロセッサ144に制
御を転送する。
【0079】ステップ708および710で、認識結果
プロセッサ144は、加入者が確認を促された後に、戻
された候補結果をそれぞれ検索かつ評価する。ステップ
710は前記の図6の説明に従って実行される。次に、
ステップ712で、インタプリタ134がステップ71
2での確認結果が良かったかどうかを決定する。もし肯
定であれば、インタプリタ134はステップ712で成
功裡の確認の状態インディケータを設定し、その後に認
識コマンド発生器142はステップ720で先に選択さ
れたSPAB300(すなわち図5のステップ500を
介して最も新たに選択されたSPAB300)のなかの
指定された認識器パラメータを再記憶する。ステップ7
20の後で、この好ましい方法は終了する。
【0080】もし確認の結果が良くなかったならば、イ
ンタプリタはステップ714で再確認が必要とされるか
どうかを決定される。再確認は好ましくは、認識結果プ
ロセッサ144が確認が必要とされる状態のインディケ
ータもしくは反復状態インディケータを設定している時
に必要とされる。再確認が必要とされている時、この方
法は好ましくは、他の認識事象を開始するべく、ステッ
プ706に戻る。好ましい実施例では、ステップ704
で発せられる現在の確認スロンプトは再確認が行われか
回数に従って変化する。
【0081】もし認識結果プロセッサ144が確認制限
超過状態を設定しているならば、インタプリタ134は
ステップ714で再確認が必要とされないことを決定
し、またステップ716で不成功裡の確認状態のインデ
ィケータを設定する。ステップ716の後で、この好ま
しい方法はステップ720に進む。
【0082】発声ロギング 加入者の発声の記録または、ロギングはシステム検査お
よび検証、周期的な語彙構築および問題解析を助けるた
めに高度に有用である。しかし、発声ロギングはかなり
の記憶容量のメモリを必要とし、またこうしてロギング
はかなりの費用を要し得る。本発明では、ロギング費用
が最小化され得るように、ロギングおよび音声およびロ
ギング監視器230は各SPAB300のなかで指定さ
れたロギングパラメータに従って加入者発声の選択的な
ロギングを制御する。
【0083】いま図8を参照すると、本発明での発声ロ
ギングのための好ましい方法のフロ−チャートが示され
ている。好ましい実施例では、ロギングユニット146
はコールの間にトランスペアレントに作動し、インタプ
リタ134、認識コマンド発生器142および認識結果
プロセッサ144の作動をモニターする。この好ましい
方法は、ステップ800で、ロギングユニット146
が、発声ロギングが現在のコールの間に必要とされるか
どうかを決定するべく、現在選択されているSPAB3
00(すなわち図5のステップ500で選択されたSP
AB300)のなかのロギングパラメータを検査するこ
とにより開始する。もし発声ロギングが現在のコールの
間に必要とされないならば、この好ましい方法は終了す
る。
【0084】もし発声ロギングが必要とされるならば、
ロギングコントローラ146はステップ802でロギン
グパラメータに従って現在のロギング条件を確立する。
好ましい実施例では、ロギングパラメータは、先に図4
Aに関して説明されたように、ロギングが必要とされる
種々の条件を指示する。ロギングユニット146は次い
でステップ804で、次の認識事象がログされるべきか
どうかを決定する。もし肯定であれば、ロギングユニッ
ト146はステップ806で音声およびロギング監視器
230にサンプリングパラメータの集合を発する。サン
プリングパラメータは好ましくは発声ロギングが下記の
参照時間定義に従って開始すべきかどうかを決定する: ・認識の試みの開始時; ・ここで“音声の開始”として定義されているように、
音声を示唆する音量およびスペクトル成分を有するオー
ディオ信号が検出された時;および ・ここで“発声の開始”として定義されているように、
音声認識器222が発声が有意義であることを確信して
おり、またテンプレート合致プロセスを開始している
時。
【0085】サンプリングパラメータは追加的に、発声
ロギングが下記の参照時間定義に従って終了すべきかど
うかを決定する: ・発声ロギングの開始以後に予め定められた時間が経過
した後; ・ここで“音声の終了”として定義されているように、
音声らしいデータが検出された後; ・ここで“発声の終了”として定義されているように、
候補結果が発生された後。
【0085】いま図9Aをも参照すると、上記のように
定義された参照時間のグラフィック表示が示されてい
る。上記の参照時間を評価の際の時間遅れを補うべく、
バッファが好ましくは、サンプリング周期が示されてい
る開始および終了時点に対して相対的に近似的に0.5
ないし1秒延長され得るように、最も新しい1秒間隔に
相当するオーディオデータを保持する。音声およびロギ
ング監視器230は認識の試みの間のロギングを指令
し、またロギングバッファ228のなかにログされた発
声を蓄積する。
【0086】再び図8を参照すると、ステップ806の
後に、ロギングユニット146がステップ808で認識
結果プロセッサ144が現在の候補結果に対する質評価
を完了しているかどうかを決定する。もし否定であれ
ば、この好ましい方法はステップ808にとどまる。い
ったん最も新しい認識事象の最終結果が知られていれ
ば、ロギングユニット146がステップ808でロギン
グパラメータのなかで指定されたどの規範も適合されて
いるかどうかを決定する。もし肯定であれば、ロギング
ユニット146が音声およびロギング監視器230に、
ステップ812で発声ヘッダーおよび最も新しい認識事
象の間に記録された発声を蓄積するように命令する。発
声ヘッダーは好ましくは音声UIのなかの位置またはロ
ケーションへの参照と、再度の試みのカウントと、通信
カウントと、音声認識器222により発生された候補結
果の集合と、認識器により発せられたタイミングデータ
と、プロンプトの実行および割込みに関係付けられるタ
イミングデータと、DTMF信号またはハング‐アップ
のような外部事象の到来に対応するタイミングデータと
を含んでいる。発声自体は好ましくは8ビットmu‐l
awプロトコルに従ってコード化されている。各々の発
声ヘッダーおよび対応する発声は好ましくはロギングバ
ッファ228のなかの利用可能な記憶ロケーションへの
参照またはポインタにより与えられるロケーションにお
いてロギングバッファ228のなかに蓄積される。ロギ
ングユニット146は好ましくはこのポインタを維持す
る。ステップ812が完了すると、ロギングユニット1
46は現在のロギングパラメータを検査し、また蓄積さ
れた発声がステップ816でその後の使用のために保持
されるべきかどうかを決定する。特定の環境のもとで
は、ログされた発声が蓄積されるべきかどうかの知識
は、加入者のコールが音声UIのなかの特定の点に進み
終わるまで確かめられ得ない。たとえば、ロギングの開
始は好ましくはコールの開始時に生起する。しかし、も
しロギングが特定のパスワード番号に対して生起すべき
であれば、加入者のパスワード番号は、コールがパスワ
ードエントリメニューのコンテキストのなかでなされた
加入者の発声が成功裡に認識かつ処理され終わる点に進
み終わるまで、知られていない。
【0087】もし発声データが保持されているべきであ
れば、ロギングユニット146はステップ816で次の
利用可能なロケーションへのロギングバッファ‐記憶ロ
ケーション参照を更新する。
【0088】ステップ816の後で、またはステップ8
04、810および814の後で、ロギングユニット1
46はステップ818で現在のコールが完了しているか
どうかを決定する。もし否定であれば、この好ましい方
法はステップ804に戻る。現在のコールが完了した後
に、ロギングユニット146がステップ820でコール
ヘッダーを発生し、また続いてステップ822でデータ
記憶ユニット170もしくは報告システムにコールヘッ
ダー情報と蓄積された発生の集合とを転送する。好まし
い実施例では、コールヘッダー情報はメールボックスI
Dと、タイムスタンプと、可能性として、図19を参照
して後で詳細に説明されるカストマー‐データ‐レコー
ド(CDR)への参照とを含んでいる。ステップ822
の後で、この好ましい方法は終了する。
【0089】いま図9Bを参照すると、好ましい発声記
憶形式900のブロック図が示されている。好ましい発
声記憶形式のなかで、コールヘッダー902は発声ヘッ
ダー/発声オーディオデータ‐シーケンス904により
続かれている。ロギングバッファ228のなかに、現在
のロギング‐ロケーションおよび以前のロギング‐ロケ
ーションへのポインタが当業者により容易に理解される
仕方で維持されている。
【0090】報告 システム性能データの発生はシステム問題解析のために
高度に有用である。本発明では、報告ユニット148
は、特定のシステム性能統計を蓄積する種々のカストマ
ー‐データ‐レコード(CDR)を選択的に発生する。
好ましい実施例では、報告ユニット148はコールの間
にトランスペアレントに作動し、また、各SPAB30
0のなかで指定された報告パラメータに従ってシステム
性能を追跡し、またCDRを発生するべく、インタプリ
タ134、認識コマンド発生器142および認識結果プ
ロセッサ144をモニターする。各CDRの発生のため
に、報告ユニット148はコール統計ライブラリのなか
の統計の集合を維持する。
【0091】好ましい実施例では、報告ユニット148
は認識‐レベルCDR、通信‐レベルCDR、コール‐
レベルCDRおよび(または)合計‐レベルCDRを選
択的に発生する。認識‐レベルCDRは好ましくは下記
のことを指定する: ・通信のなかの各認識の結果; ・現在のSPAB300のなかで指定されるような、予
め定められた認識結果へのシステムの応答; ・各認識に対するロギング状態; 各認識事象の継続時間;および各認識事象に対する候補
語IDおよび対応するスコア。
【0092】下記のことは好ましくは通信‐レベルCD
Rにより指定される: ・通信に続いて行われる作用を指示する結果; ・SMT250により指定されている予め定められた数
の認識の試みを必要とする加入者入力の割合; ・正しくない試みの数; ・タイムアウトの数; ・肯定的な確認が生起したかどうか;および ・通信の継続時間。
【0093】コール‐レベルCDRは下記の情報を提供
する: ・音声が使用されたコールの割合; ・音声が使用されたディジット‐ストリングの割合; ・予め定められた数の認識の試みを必要とするディジッ
ト‐ストリング入力の割合; ・タイムアウトが生起した認識事象の割合; ・確認を必要とする認識事象の割合; ・失敗した認識事象の割合; ・認識事象の平均継続時間; ・平均通信継続時間。
【0094】最後に、合計‐レベルCDRは下記の情報
を含んでいる: ・加入者がDTMFの使用に戻ったコールの割合; ・SRVMS10がDTMF‐UIに戻ったコールの割
合; ・音声UIが再び呼び出されたコールの割合;および ・ハング‐アップ条件が不成功裡の認識に続いたコール
の割合。
【0095】当業者は前記の情報が発生され、かつ(ま
たは)インタプリタ134、認識コマンド発生器14
2、認識結果プロセッサ144、音声およびロギング監
視器および音声認識器222により実行されるオペレー
ションを追跡することにより更新される仕方を容易に理
解するであろう。当業者は追加的に、特定の情報の有用
さに従って、追加的なまたはより少数の統計が代替的な
実施例で発生され得ることを認識するであろう。
【0096】いま図10を参照すると、カストマー‐デ
ータ‐レコードを創造するための好ましい方法が示され
ている。この好ましい方法は、ステップ1000で報告
ユニット148が、現在の報告条件を確立するべく、現
在のSPAB300のなかで指定された報告パラメータ
を検索することにより開始する。次に、報告ユニット1
48はステップ1002で認識‐レベルCDRが発生さ
れるべきかどうかを決定する。もし肯定であれば、報告
ユニット148はステップ1004および1006で認
識結果および認識結果表プロセスをモニターし、また認
識統計を発生かつ(または)更新する。
【0097】ステップ1004またはステップ1006
の後で、報告ユニット148がステップ1008で現在
の通信が完了しているかどうかを決定する。もし否定で
あれば、この好ましい方法はステップ1002に戻る。
いったん現在の通信が完了しているならば、報告ユニッ
ト148がステップ1010で通信‐レベルCDRの発
生が必要とされるかどうかを決定する。もし肯定であれ
ば、報告ユニット148はステップ1012で通信統計
を発生かつ(または)更新する。ステップ1010また
はステップ1012の後で、報告ユニット148は、ス
テップ1014で現在のコールが完了しているかどうか
を決定する。もし否定であれば、この好ましい方法はス
テップ1002に戻る。
【0098】現在のコールが完了すると、報告ユニット
148はコール‐レベルCDRが発生されるべきかどう
かを決定する。もし肯定であれば、報告ユニット148
はそれぞれステップ1016および1018でコール統
計を発生かつ(または)更新する。もしコール‐レベル
CDRの発生が必要とされないならば、またはステップ
1018の後に、報告ユニット148は、コール統計ラ
イブラリ152のなかに維持されている統計を使用し
て、ステップ1020で各々の必要とされるCDRを発
生する。好ましくは、各CDRは、適切な統計情報が常
駐しているデータファイルを含んでいる。CDRが発生
され終わった後、報告ユニット148は報告システム1
2へのそれらの転送を指令する。
【0099】本発明を特定の好ましい実施例を参照して
説明してきたが、当業者は種々の変更が行われ得ること
を理解するであろう。たとえば、発声者に関係する認識
が加入者により発生される対応するディジット‐ストリ
ングを有するキーワードを置換するのに使用され得よ
う。本発明に対するこの変更およびここに記載された実
施例のコンテキストのなかにある他の変更は、特許請求
の範囲によってのみ限定される本発明の範囲内にあるも
のとする。
【図面の簡単な説明】
【図1】本発明が機能する典型的な音声メッセージ環境
のブロック図。
【図2】本発明により音声メッセージ加入者に提供され
る音声ユーザーインタフェースメニューの好ましい最小
の集合のフロ−チャート。
【図3】本発明に従って構成された音声応答‐音声メッ
セージの好ましい実施例のブロック図。
【図4】本発明の音声パラメータブロック(A)および
語彙モジュール(B)の好ましい実施例のブロック図。
【図5】本発明に従って音声に応答して音声メッセージ
を送るための好ましい方法のフローチャート
【図6】本発明で音声認識結果を評価するための好まし
い方法のフロ−チャート。
【図7】本発明で音声認識結果を確認するための好まし
い方法のフロ−チャート。
【図8】本発明で発声をロギングするための好ましい方
法のフロ−チャート。
【図9】発声サンプリングに関係付けられた参照時間の
グラフィックな表示(A)と本発明での好ましい発声記
憶形式のブロック図(B)。
【図10】本発明でカストマーデータレコードを発生す
るための好ましい方法のフロ−チャート。
【符号の説明】
60 セルラ電話システムサービスエリア 70 移動電話交換局(MTSO) 80 セルラ無線設備 90 移動加入者電話 92 移動非加入者電話 100 システム制御ユニット 130 制御ユニットメモリ 180 ディジタルラインカード(DLC) 220 DLCメモリ 260 第1のコントロールバス 262 第1のデータバス 280 第2のデータバス 282 第2のコントロールバス 300 音声パラメータブロック(SPAB) 320 語彙モジュール 900 発声記憶形式
フロントページの続き (51)Int.Cl.6 識別記号 FI G10L 3/00 561 G10L 3/00 561B 571 571L H04M 3/50 H04M 3/50 A (72)発明者 スザナー アルブライト アメリカ合衆国 94025 カリフオルニア メンロ パーク カレツジアヴエニユー 709 (72)発明者 カミール グライスキー アメリカ合衆国 94025 カリフオルニア サンホセ アペニーズサークル 5292 (72)発明者 レオナード ラブ アメリカ合衆国 94086 カリフオルニア サニーヴエイル #3046 エスカロン アヴエニユー 100

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】 音声に応答して音声メッセージを送るた
    めの方法において、 a)それぞれコマンドと発声との間の潜在的な合致に対
    応する候補結果の集合を発生する過程と、 b)複数個の質しきいに従って候補結果の質を評価する
    過程と、 c)候補結果評価の質に従って、音声ユーザーインタフ
    ェース‐ナビゲーションオペレーションおよび音声メッ
    セージオペレーションの群からの1つを呼び出す過程と
    を含んでいることを特徴とする音声応答メッセージング
    方法。
  2. 【請求項2】 デュアルトーン‐多重周波数(DTM
    F)信号に応答して音声メッセージを送ることを特徴と
    する請求項1記載の方法。
  3. 【請求項3】 前記ステップa)が、発声の検出と発声
    に相当する句の特定のコマンド語の識別とを含み、その
    際該検出および/または識別は、好ましくはテンプレー
    トライブラリ(226)および自動応答ライブラリ(2
    34)と共に音声認識器(222)により実行され、音
    声認識器(222)は好ましくは認識コマンド発声器
    (142)および音声およびロギング監視器(230)
    により制御されることを特徴とする請求項1または2記
    載の方法。
  4. 【請求項4】 前記ステップc)が、音声ユーザーイン
    ターフェースのどの部分が加入者に与えられるかを制御
    し、音声ユーザーインターフェースの1つの部分から他
    の部分へ選択的に移行し、または前記ステップb)にお
    いて実行される評価の結果に基づいて音声メッセージ機
    能を呼び出す過程を含み、この制御、移行および/また
    は呼出しステップはインタプリタ(134)、音声ユー
    ザーインターフェース(UI)構造(138)および音
    声メッセージ(VM)機能ライブラリ(132)を通じ
    て容易にされることを特徴とする請求項1ないし3の1
    つに記載の方法。
  5. 【請求項5】 加入者への選択的に割込み可能なプロン
    プトおよびメッセージが発信され、その際この発行を制
    御するステップは、これはインタプリタ(134)と、
    ユーザーインターフェース構造(136、138、14
    0)と、音声メッセージ機能ライブラリ(132)のな
    かの少なくとも1つの音声メッセージ機能と、句拡張器
    (232)とにより容易にされ、その際好ましくは、句
    拡張器(232)はDTMFプロセッサ(224)およ
    び音声およびロギング監視器(230)により発せられ
    る信号に応答し、音声認識器(222)に接続されてい
    ることを特徴とする請求項1ないし4の1つに記載の方
    法。
  6. 【請求項6】 DTMFユーザーインターフェースの1
    つまたはそれ以上の部分が音声ユーザーインターフェー
    スと並列に利用可能であり、DTMFユーザーインター
    フェースは、認識誤りが反復して生じそうな状況のもと
    でバックアップとして働き、この機能はインタプリタ
    (134)、音声メッセージ機能ライブラリ(132)
    およびDTMFユーザーインターフェース構造(13
    6)により容易にされ、音声応答メッセージングシステ
    ム(SRVMS)性能情報が選択的に発生かつ解析さ
    れ、これはロギングユニット(146)、報告ユニット
    (148)および音声およびロギング監視器(230)
    により容易にされていることを特徴とする請求項1ない
    し5の1つに記載の方法。
  7. 【請求項7】 音声応答メッセージングシステム(SR
    VMS)(10)は、システム制御ユニット(100)
    と、ディスクおよび音声I/O制御ユニット(160)
    と、データベースディレクトリエントリおよび各加入者
    に対するメールボックスが常駐しているデータ蓄積ユニ
    ット(170)と、少なくとも1つのディジタルライン
    カード(DLC)(180)と、各DLC(180)に
    対応する電話インタフェースコントローラ(TIC)
    (185)と、システムマネージャターミナル(SM
    T)(250)とを含み、音声応答メッセージングシス
    テム(10)の要素は第1のコントロールバス(26
    0)および第1のデータバス(262)を介して選択的
    に接続され、各TIC(185)は中央局(CO)スイ
    ッチ(20)に接続されており、システム制御ユニット
    (100)はSMT(250)を介して受信されるシス
    テムパラメータに従ってSRVMS(10)の全体作動
    を管理し、DLC(180)は音声データをCOスイッ
    チ(20)と交換し、DTMF信号を処理し、システム
    制御ユニット(100)の指令のもとに音声認識および
    ロギングオペレーションを実行することを特徴とする音
    声応答メッセージング装置。
  8. 【請求項8】 システム制御ユニット(100)は、以
    下のコンポーネントの少なくとも1つ、バスおよび直接
    記憶アクセス(DMA)コントローラ(110)と、処
    理ユニット(120)と、メモリ(13)とを含み、該
    メモリ(13)中には、音声メッセージ(VM)機能ラ
    イブラリ(132)、インタプリタ(134)、DTM
    Fユーザーインターフェース構造(136)、音声ユー
    ザーインターフェース構造(138)、およびあいまい
    さレゾリューションUI構造(140)、認識コマンド
    発生器(142)、認識結果プロセッサ(144)、ロ
    ギングユニット(146)、報告ユニット(148)、
    音声パラメータブロック(SPAB)ライブラリ(15
    0)およびコール統計ライブラリ(152)が常駐して
    おり、バスおよびDMAコントローラ(110)と、処
    理ユニット(120)と、メモリ(130)のなかの各
    要素とは内部バス(270)を介して接続されており、
    バスおよびDMAコントローラ(110)はさらに第1
    のデータおよびコントロールバス(260、262)、
    SMT(250)にも報告システム(12)にも接続さ
    れており、バスおよびDMAコントローラ(110)と
    報告システム(12)との間の接続は、多重の接続線を
    含んでおり、 DLC(180)は、DLCバスコントローラ(19
    0)、DLC処理ユニット(200)、コーダ/デコー
    ダ(CODEC)(210)およびDLCメモリ(22
    0)を含み、その際DLCメモリ(220)は、音声認
    識器(222)、DTMFプロセッサ(224)、テン
    プレートライブラリ(226)、ロギングバッファ(2
    28)、音声およびロギング監視器(230)、句拡張
    器(232)、自動応答ライブラリ(234)、パルス
    符号変調(PCM)データバッファ(236)および信
    号コンディショナ(238)を含み、その際DLCメモ
    リ(220)のなかの各要素は、第2のデータバス(2
    80)を介してDLCバスコントローラ(190)およ
    びDLC処理ユニット(200)に接続され、DLCバ
    スコントローラ(190)は、第2のコントロールバス
    (280)を介してDLC処理ユニット(200)に、
    かつ第1のデータおよびコントロールバス(260、2
    62)に接続され、CODEC(210)は、PCMデ
    ータバッファ(236)と電話インタフェースコントロ
    ーラ(185)との間のDMA形式のオペレーションを
    行うべく、PCMデータバッファ(236)およびDL
    Cバスコントローラ(190)に接続されていることを
    特徴とする請求項7記載の装置。
  9. 【請求項9】 以下のステップ、 a)DLCバスコントローラ(190)からインタプリ
    タ(134)に到来したコール報知を受信し、 b)コール報知に応答して最初の音声パラメータブロッ
    ク(SPAB)(300)への参照をインタプリタ(1
    34)から認識コマンド発生器(142)に転送し、 c)認識コマンド発生器(142)により最初のSPA
    B(300)を選択し(500)、 d)認識コマンド発生器(142)は選択されたSPA
    B(300)のなかの少なくとも1つの認識器パラメー
    タを検索し(502)、 e)認識コマンド発生器(142)は音声およびロギン
    グ監視器(230)への認識パラメータ宣言を発し(5
    04)、 f)認識コマンド発生器(142)は認識リクエストを
    発行し(506)、 g)VM機能ライブラリ(132)のなかの音声メッセ
    ージ機能が現在のプロンプトを選択し、句拡張器232
    へのプロンプト報知を発行し(508)、 h)句拡張器(232)が、PCMデータバッファ(2
    36)、CODEC(210)およびTIC(185)
    を介して、加入者に現在のプロンプトを発行し、 i)認識結果プロセッサ(144)が候補結果を検索し
    (510)、 k)認識結果プロセッサ(144)は、戻された候補結
    果の質を評価し(512)、 好ましくは認識結果プロセッサ(144)は、この評価
    の結果を表す値をインタプリタ(134)に戻し、 l)インタプリタ(134)は、認識が反復されるべき
    かどうかを決定し(514)、 m)予め決められた反復カウントが超過されていないか
    ぎり、好ましくはステップg)のバリエーションととも
    に、ステップf)〜l)が反復され、反復がカウントさ
    れ、 n)もし反復カウントが超過された場合には、インタプ
    リタ(134)はDTMF‐UIに移行し、この方法は
    終了し、 o)もし反復カウントが超過されない場合には、インタ
    プリタ(134)は認識確認が必要とされるかどうかを
    決定し、もし確認が必要とされないならば、この方法は
    ステップr)により続けられ、もし確認が必要とされる
    ならば、この方法はステップp)により続けられ、 p)インタプリタ(134)は、あいまいさレゾリュー
    ションUI構造(140)のなかの位置またはロケーシ
    ョンを選択し、確認SPAB(300)への参照を認識
    コマンド発生器(142)に転送し、 q)インタプリタ(134)は、確認が成功したかどう
    かを決定し、もし確認が成功しなかった場合、方法はス
    テップf)に戻り、もし確認が成功した場合、方法はス
    テップr)により続けられ、 r)インタプリタ(134)は、ディジット‐シーケン
    スへの最良の候補語IDをマップするマッピング機能に
    制御を転送し(530)、 s)インタプリタ(134)は、マップされたディジッ
    ト‐シーケンスが音声UIナビゲーション‐オペレーシ
    ョンに相当するかどうかを決定し(532)、もし肯定
    であれば、方法はステップt)により続けられ、もし否
    定であれば、方法はステップo)により続けられ、 t)インタプリタ(134)は、音声ユーザーインター
    フェース内の位置またはロケーションを選択し(53
    4)、方法はステップw)により続けられ、 u)インタプリタ(134)は、マップされたディジッ
    ト‐シーケンスに相応する音声メッセージ機能に制御を
    転送し(536)、 v)インタプリタ(134)は、通信カウントを更新し
    (538)、 w)インタプリタ(134)は、加入者コールが完了し
    ているかどうかを決定し(540)、もし加入者コール
    が完了していれば、方法は終了し、そうでなければ、方
    法はステップc)で続けられるから成ることを特徴とす
    る音声応答メッセージング方法。
  10. 【請求項10】 以下のステップ、 a)確認(SPAB)データを検索し(700)、 b)認識器パラメータを設定し(702)、 c)現在の確認プロンプトを決定し、確認プロンプト報
    知を発信し、 d)認識リクエストを発行し、 e)認識結果を検索し(706) f)検索された候補結果を評価し、 g)認識結果が良かったかどうかを評価し、もし認識結
    果が良かったならば、方法はステップh)により続けら
    れ、そうでないならば、方法はステップk)により続け
    られ、 h)成功した確認の状態インディケータを設定し(71
    8)、方法はステップm)により続けられ、 k)再確認が必要とされるかどうかが決定され(71
    4)、もし再確認が必要ならば、方法は好ましくはステ
    ップd)により続けられ、もし再確認が必要でないな
    ら、方法はステップl)により続けられ、 l)不成功の確認の状態を設定し(716)、 m)認識器パラメータを復帰し(720)、方法は終了
    する、から成ることを特徴とする音声認識結果を確認す
    る方法。
  11. 【請求項11】 以下のステップ、 a)候補結果の集合が回復不可能な誤りまたはタイムア
    ウト条件が生起したことを指示するかどうかを決定し
    (600)、もし肯定であれば、方法はステップl)に
    より続けられ、もしそうでなければ、方法はステップ
    b)により続けられ、 b)(次の)候補結果を選択し(620)、 c)候補結果を現在の質しきいと比較し(622)、 d)候補質を決定し(624)、 e)他の候補結果が考察を必要とするかどうかが決定さ
    れ(626)、もしそうであれば、方法はステップb)
    により続けられ、そうでなければ、方法はステップf)
    により続けられ、 f)少なくとも1つの候補結果が良いとして指定されて
    いるかどうかが決定され(630)、もしそうであれ
    ば、方法はステップk)により続けられ、そうでなけれ
    ば、方法はステップg)により続けられ、 g)疑わしい候補結果が存在するかどうかが決定され
    (640)、もしそうであれば、方法はステップh)に
    より続けられ、そうでなければ、方法はステップl)に
    より続けられ、 h)確認が必要とされる状態のインディケータが設定さ
    れ(642)、 i)良い候補結果の1つが返され、方法は終了する、 k)よい結果の状態が設定され(638)、方法はステ
    ップi)により続けられ、 l)悪い結果の状態が設定され(602)、 m)反復カウントをインクリメントし(604)、 n)予め決められた制限が超過されたかどうかを決定し
    (606)、もしそうであれば、方法はステップp)に
    より続けられ、そうでなければ、方法はステップo)に
    より続けられ、 o)反復状態を設定し(608)、方法を終了する、 p)制限超過状態を設定し(610)、方法を終了す
    る、 好ましくは、ステップf)においてkはqにより置き換
    えられ、ステップk)においてiはtにより置き換えら
    れ、 q)多重の良い候補が存在するかどうかが決定され(6
    32)、もしそうであれば、方法はステップr)により
    続けられ、そうでなければ、方法はステップk)により
    続けられ、 r)各々の良い候補結果の間のスコアの差が検査され
    (634)、 s)差しきいがちょうかされているかどうかが決定され
    (636)、もしそうであれば、方法はステップk)に
    より続けられ、そうでなければ、方法はステップh)に
    より続けられ、 t)最良の候補を返し(611)、方法は終了する、か
    ら成ることを特徴とする音声認識結果を評価する方法。
  12. 【請求項12】 ステップf)が請求項11の方法に従
    って遂行されることを特徴とする請求項10記載の方
    法。
  13. 【請求項13】 以下のステップ、 a)好ましくは報告パラメータを検索することにより、
    報告条件が確立され(1000)、 b)認識−レベルCDRが発生されるべきかどうかが決
    定され(1002)、もしそうであれば、方法はステッ
    プc)により続けられ、そうでなければ、方法はステッ
    プe)により続けられ、 c)認識結果がモニタされ(1004)、 d)認識統計が発生および/または更新され(10
    6)、 e)現在の通信が完了されたかどうかが決定され、もし
    そうであれば、方法はステップf)により続けられ、そ
    うでなければ、方法はステップb)により続けられ、 f)通信レベルCDRが発生されるべきかどうかが決定
    され(1010)、もしそうであれば、方法はステップ
    g)により続けられ、そうでなければ、方法はステップ
    h)により続けられ、 g)通信統計が発生され(1012)、 h)コールが完了されたかどうかが決定され(101
    6)、もしそうでなければ、方法はステップb)により
    続けられ、そうであれば、方法はステップi)により続
    けられ、 i)コールレベルCDRが発生されるべきかどうかが決
    定され(1010)、もしそうであれば、方法はステッ
    プk)により続けられ、そうでなければ、方法はステッ
    プl)により続けられ、 k)コール統計を発生し(1018)、 l)各々の必要とされるCDRを発生し(1020)、
    方法を終了する、から成るカスタマーデータレコードを
    生成するための方法であって、カスタマーデータレコー
    ドは、好ましくは報告ユニット(148)の中で生成さ
    れ、その際、報告ユニット(148)は、コールの間に
    トランスペアレントに作動し、各SPAB(300)の
    なかで指定された報告パラメータに従ってシステム性能
    を追跡し、CDRを発生するべく、インタプリタ(13
    4)、認識コマンド発生器(142)および認識結果プ
    ロセッサ(144)をモニターし、各CDRの発生のた
    めに、コール統計ライブラリ(152)のなかの統計の
    集合を維持することを特徴とするカスタマーデータレコ
    ードを生成するための方法。
  14. 【請求項14】 以下のステップ、 a)発声ロギングが現在のコールの間に必要とされるか
    どうかを決定するためのロギングパラメータを検査し
    (800)、もし方法が終了せず、発声ロギングが必要
    とされるばらば、方法はステップb)により続けられ、 b)ロギング条件を確立し(802)、 c)次の認識事象がログされるべきかどうかが決定され
    (804)、もしそうでなければ、方法はステップk)
    により続けられ、もしそうであれば、方法はステップ
    d)により続けられ、 d)少なくとも1つのサンプリングパラメータの集合を
    設定し(806)、 e)現在の候補結果に対する質評価が完了しているかど
    うかを決定し(808)、もしそうでなければ、方法は
    ステップe)により続けられ、もしそうであれば、方法
    はステップf)により続けられ、 f)ロギングパラメータのなかで指定されたどの規範も
    適合されているかどうかを決定し(810)、もしそう
    でなければ、方法はステップk)により続けられ、もし
    そうであれば、方法はステップg)により続けられ、 g)発声を蓄積し(812)、 h)現在のロギングパラメータを検査し、蓄積された発
    声がその後の使用のために保持されるべきかどうかを決
    定し、もしそうでなければ、方法はステップk)により
    続けられ、もしそうであれば、方法はステップi)によ
    り続けられ、 i)次の利用可能なロケーションへのロギングバッファ
    記憶ロケーション参照を更新し、(816) k)現在のコールが完了されているかを決定し、もしそ
    うでなければ、方法はステップc)により続けられ、も
    しそうであれば、方法はステップl)により続けられ、 l)コールヘッダー情報を発生し(820)、 m)ロギングデータをデータ蓄積デバイスに転送し(8
    22)、方法は終了する、 から成る発声ロギングのための方法において、好ましく
    は方法は、SPAB(300)の群の各々のなかで指定
    されたロギングパラメータに従って、発声の選択的なロ
    ギングを制御するロギングユニット(146)および音
    声及びロギング監視器(230)によって遂行され、好
    ましくは、ロギングユニット(146)は、コールの間
    にトランスペアレントに作動し、インタプリタ(13
    4)、認識コマンド発生器(142)および認識結果プ
    ロセッサ(144)の作動をモニターし、コールヘッダ
    ー情報は、好ましくは、メールボックスIDと、可能性
    として、カストマーデータレコード(CDR)への参照
    とを含んでおり、その際カストマーデータレコードは好
    ましくは請求項13の方法により生成されることを特徴
    とする発声ロギングのための方法。
  15. 【請求項15】 請求項11の方法および/または請求
    項10または12の方法および/または請求項13の方
    法を含むことを特徴とする方法。
JP10095390A 1997-03-24 1998-03-24 音声応答メッセージング方法および装置 Pending JPH1188502A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/822,034 US6094476A (en) 1997-03-24 1997-03-24 Speech-responsive voice messaging system and method
US08/822034 1997-03-24

Publications (1)

Publication Number Publication Date
JPH1188502A true JPH1188502A (ja) 1999-03-30

Family

ID=25234935

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10095390A Pending JPH1188502A (ja) 1997-03-24 1998-03-24 音声応答メッセージング方法および装置

Country Status (4)

Country Link
US (5) US6094476A (ja)
EP (1) EP0867861A3 (ja)
JP (1) JPH1188502A (ja)
CA (1) CA2233019C (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006268832A (ja) * 2005-03-22 2006-10-05 Microsoft Corp 選択可能な状態機械ユーザインターフェースシステム
US7260534B2 (en) 2002-07-16 2007-08-21 International Business Machines Corporation Graphical user interface for determining speech recognition accuracy
JP2008511256A (ja) * 2004-08-26 2008-04-10 エーティー アンド ティー ナレッジ ベンチャーズ エル.ピー. スピーチにより可能とされたコールセンター環境において自動化されたコールルーティング応用を実行する方法、システム、およびソフトウェア
US8090083B2 (en) 2004-10-20 2012-01-03 Microsoft Corporation Unified messaging architecture
JP2012516636A (ja) * 2009-01-29 2012-07-19 フォード グローバル テクノロジーズ、リミテッド ライアビリティ カンパニー 無線通信リンク上で次の入力を合図するために、指示プロンプトを中断するシステムと方法
JP2016505897A (ja) * 2013-01-04 2016-02-25 コピン コーポレーション 二分岐音声認識

Families Citing this family (140)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7590224B1 (en) * 1995-09-15 2009-09-15 At&T Intellectual Property, Ii, L.P. Automated task classification system
US20030154072A1 (en) * 1998-03-31 2003-08-14 Scansoft, Inc., A Delaware Corporation Call analysis
US6504912B1 (en) * 1998-07-07 2003-01-07 At&T Corp. Method of initiating a call feature request
US6606598B1 (en) * 1998-09-22 2003-08-12 Speechworks International, Inc. Statistical computing and reporting for interactive speech applications
US6185535B1 (en) * 1998-10-16 2001-02-06 Telefonaktiebolaget Lm Ericsson (Publ) Voice control of a user interface to service applications
US6757718B1 (en) * 1999-01-05 2004-06-29 Sri International Mobile navigation of network-based electronic information using spoken input
US6574596B2 (en) * 1999-02-08 2003-06-03 Qualcomm Incorporated Voice recognition rejection scheme
US7260187B1 (en) 1999-05-11 2007-08-21 Verizon Services Corp. Voice response apparatus and method of providing automated voice responses with silent prompting
US6401066B1 (en) 1999-11-09 2002-06-04 West Teleservices Holding Company Automated third party verification system
US7206746B1 (en) 1999-11-09 2007-04-17 West Corporation Third party verification system
US7130800B1 (en) 2001-09-20 2006-10-31 West Corporation Third party verification system
GB9929284D0 (en) * 1999-12-11 2000-02-02 Ibm Voice processing apparatus
US7120234B1 (en) * 1999-12-29 2006-10-10 Bellsouth Intellectual Property Corp. Integrated tone-based and voice-based telephone user interface
US6601031B1 (en) * 2000-01-13 2003-07-29 Lucent Technologies Inc. Speech recognition front end controller to voice mail systems
US20040006473A1 (en) * 2002-07-02 2004-01-08 Sbc Technology Resources, Inc. Method and system for automated categorization of statements
US6907111B1 (en) 2000-08-09 2005-06-14 Bellsouth Intellectual Property Corporation Network and method for providing a name and number delivery telecommunications services with automatic speech recognition capability
US6505163B1 (en) * 2000-08-09 2003-01-07 Bellsouth Intellectual Property Corporation Network and method for providing an automatic recall telecommunications service with automatic speech recognition capability
US6826529B1 (en) 2000-08-09 2004-11-30 Bellsouth Intellectual Property Corporation Network and method for providing a call screening telecommunications service with automatic speech recognition capability
US6873686B1 (en) 2000-08-09 2005-03-29 Bellsouth Intellectual Property Corporation Network and method for providing a calling name telecommunications service with automatic speech recognition capability
US6778640B1 (en) * 2000-08-09 2004-08-17 Bellsouth Intellectual Property Corporation Network and method for providing a user interface for a simultaneous ring telecommunications service with automatic speech recognition capability
JP3705735B2 (ja) * 2000-08-29 2005-10-12 シャープ株式会社 オンデマンド・インタフェース装置とそのウィンドウ表示装置
US7212969B1 (en) * 2000-09-29 2007-05-01 Intel Corporation Dynamic generation of voice interface structure and voice content based upon either or both user-specific contextual information and environmental information
US7047197B1 (en) * 2000-09-29 2006-05-16 Intel Corporation Changing characteristics of a voice user interface
US7451085B2 (en) * 2000-10-13 2008-11-11 At&T Intellectual Property Ii, L.P. System and method for providing a compensated speech recognition model for speech recognition
US6941266B1 (en) * 2000-11-15 2005-09-06 At&T Corp. Method and system for predicting problematic dialog situations in a task classification system
US6658386B2 (en) * 2000-12-12 2003-12-02 International Business Machines Corporation Dynamically adjusting speech menu presentation style
US6868142B2 (en) * 2001-01-10 2005-03-15 At&T Corp. Voice-operated interface for DTMF-controlled systems
US6731724B2 (en) * 2001-01-22 2004-05-04 Pumatech, Inc. Voice-enabled user interface for voicemail systems
JP3919210B2 (ja) * 2001-02-15 2007-05-23 アルパイン株式会社 音声入力案内方法及び装置
US7191133B1 (en) 2001-02-15 2007-03-13 West Corporation Script compliance using speech recognition
US7739115B1 (en) 2001-02-15 2010-06-15 West Corporation Script compliance and agent feedback
US7966187B1 (en) 2001-02-15 2011-06-21 West Corporation Script compliance and quality assurance using speech recognition
US8180643B1 (en) 2001-02-15 2012-05-15 West Corporation Script compliance using speech recognition and compilation and transmission of voice and text records to clients
US7664641B1 (en) 2001-02-15 2010-02-16 West Corporation Script compliance and quality assurance based on speech recognition and duration of interaction
US6823054B1 (en) * 2001-03-05 2004-11-23 Verizon Corporate Services Group Inc. Apparatus and method for analyzing an automated response system
DE10110977C1 (de) * 2001-03-07 2002-10-10 Siemens Ag Bereitstellen von Hilfe-Informationen in einem Sprachdialogsystem
US6704707B2 (en) * 2001-03-14 2004-03-09 Intel Corporation Method for automatically and dynamically switching between speech technologies
US20020173333A1 (en) * 2001-05-18 2002-11-21 Buchholz Dale R. Method and apparatus for processing barge-in requests
US6810111B1 (en) * 2001-06-25 2004-10-26 Intervoice Limited Partnership System and method for measuring interactive voice response application efficiency
US7110525B1 (en) 2001-06-25 2006-09-19 Toby Heller Agent training sensitive call routing system
US7573986B2 (en) * 2001-07-18 2009-08-11 Enterprise Integration Group, Inc. Method and system for interjecting comments to improve information presentation in spoken user interfaces
US7062019B2 (en) * 2001-07-27 2006-06-13 Avaya Technology Corp. Method of providing speech recognition for IVR and voice mail systems
US20030093513A1 (en) * 2001-09-11 2003-05-15 Hicks Jeffrey Todd Methods, systems and computer program products for packetized voice network evaluation
US6701066B2 (en) * 2001-10-11 2004-03-02 Micron Technology, Inc. Delivery of solid chemical precursors
US7069213B2 (en) * 2001-11-09 2006-06-27 Netbytel, Inc. Influencing a voice recognition matching operation with user barge-in time
FR2832540A1 (fr) * 2001-11-22 2003-05-23 Thomson Licensing Sa Procede de reconnaissance vocale et, terminal multimedia mettant en oeuvre le procede
JP3837061B2 (ja) * 2001-11-28 2006-10-25 富士通株式会社 音信号認識システムおよび音信号認識方法並びに当該音信号認識システムを用いた対話制御システムおよび対話制御方法
US6819758B2 (en) 2001-12-21 2004-11-16 West Corporation Method, system, and computer-readable media for performing speech recognition of indicator tones
US20030158739A1 (en) * 2002-02-15 2003-08-21 Moody Peter A. Speech navigation of voice mail systems
US7769592B2 (en) * 2002-02-22 2010-08-03 Nuance Communications, Inc. Automatic selection of a disambiguation data field for a speech interface
US7372952B1 (en) 2002-03-07 2008-05-13 Wai Wu Telephony control system with intelligent call routing
US7016842B2 (en) * 2002-03-26 2006-03-21 Sbc Technology Resources, Inc. Method and system for evaluating automatic speech recognition telephone services
US6862343B1 (en) 2002-03-27 2005-03-01 West Corporation Methods, apparatus, scripts, and computer readable media for facilitating secure capture of sensitive data for a voice-based transaction conducted over a telecommunications network
US6804331B1 (en) * 2002-03-27 2004-10-12 West Corporation Method, apparatus, and computer readable media for minimizing the risk of fraudulent receipt of telephone calls
US7246062B2 (en) * 2002-04-08 2007-07-17 Sbc Technology Resources, Inc. Method and system for voice recognition menu navigation with error prevention and recovery
US6792096B2 (en) * 2002-04-11 2004-09-14 Sbc Technology Resources, Inc. Directory assistance dialog with configuration switches to switch from automated speech recognition to operator-assisted dialog
US6937702B1 (en) 2002-05-28 2005-08-30 West Corporation Method, apparatus, and computer readable media for minimizing the risk of fraudulent access to call center resources
US6850949B2 (en) * 2002-06-03 2005-02-01 Right Now Technologies, Inc. System and method for generating a dynamic interface via a communications network
US7403967B1 (en) 2002-06-18 2008-07-22 West Corporation Methods, apparatus, and computer readable media for confirmation and verification of shipping address data associated with a transaction
US7797159B2 (en) * 2002-09-16 2010-09-14 Movius Interactive Corporation Integrated voice navigation system and method
US8666747B2 (en) * 2002-10-31 2014-03-04 Verizon Business Global Llc Providing information regarding interactive voice response sessions
US9818136B1 (en) 2003-02-05 2017-11-14 Steven M. Hoffberg System and method for determining contingent relevance
US7676034B1 (en) 2003-03-07 2010-03-09 Wai Wu Method and system for matching entities in an auction
US7260537B2 (en) * 2003-03-25 2007-08-21 International Business Machines Corporation Disambiguating results within a speech based IVR session
US7460652B2 (en) * 2003-09-26 2008-12-02 At&T Intellectual Property I, L.P. VoiceXML and rule engine based switchboard for interactive voice response (IVR) services
US20050075894A1 (en) * 2003-10-03 2005-04-07 Sbc Knowledge Ventures, L.P. System, method & software for a user responsive call center customer service delivery solution
US7885816B2 (en) * 2003-12-08 2011-02-08 International Business Machines Corporation Efficient presentation of correction options in a speech interface based upon user selection probability
US8050918B2 (en) * 2003-12-11 2011-11-01 Nuance Communications, Inc. Quality evaluation tool for dynamic voice portals
US7415101B2 (en) * 2003-12-15 2008-08-19 At&T Knowledge Ventures, L.P. System, method and software for a speech-enabled call routing application using an action-object matrix
US7542907B2 (en) * 2003-12-19 2009-06-02 International Business Machines Corporation Biasing a speech recognizer based on prompt context
US7512545B2 (en) * 2004-01-29 2009-03-31 At&T Intellectual Property I, L.P. Method, software and system for developing interactive call center agent personas
US7936861B2 (en) * 2004-07-23 2011-05-03 At&T Intellectual Property I, L.P. Announcement system and method of use
US7580837B2 (en) 2004-08-12 2009-08-25 At&T Intellectual Property I, L.P. System and method for targeted tuning module of a speech recognition system
US7788103B2 (en) * 2004-10-18 2010-08-31 Nuance Communications, Inc. Random confirmation in speech based systems
US7461000B2 (en) * 2004-10-19 2008-12-02 International Business Machines Corporation System and methods for conducting an interactive dialog via a speech-based user interface
US8942985B2 (en) 2004-11-16 2015-01-27 Microsoft Corporation Centralized method and system for clarifying voice commands
US7844465B2 (en) * 2004-11-30 2010-11-30 Scansoft, Inc. Random confirmation in speech based systems
US7242751B2 (en) 2004-12-06 2007-07-10 Sbc Knowledge Ventures, L.P. System and method for speech recognition-enabled automatic call routing
US7809569B2 (en) * 2004-12-22 2010-10-05 Enterprise Integration Group, Inc. Turn-taking confidence
US7751551B2 (en) * 2005-01-10 2010-07-06 At&T Intellectual Property I, L.P. System and method for speech-enabled call routing
US7895039B2 (en) * 2005-02-04 2011-02-22 Vocollect, Inc. Methods and systems for optimizing model adaptation for a speech recognition system
US7865362B2 (en) * 2005-02-04 2011-01-04 Vocollect, Inc. Method and system for considering information about an expected response when performing speech recognition
US8200495B2 (en) 2005-02-04 2012-06-12 Vocollect, Inc. Methods and systems for considering information about an expected response when performing speech recognition
US7949533B2 (en) * 2005-02-04 2011-05-24 Vococollect, Inc. Methods and systems for assessing and improving the performance of a speech recognition system
US7827032B2 (en) 2005-02-04 2010-11-02 Vocollect, Inc. Methods and systems for adapting a model for a speech recognition system
US7505569B2 (en) * 2005-03-18 2009-03-17 International Business Machines Corporation Diagnosing voice application issues of an operational environment
US20060215821A1 (en) * 2005-03-23 2006-09-28 Rokusek Daniel S Voice nametag audio feedback for dialing a telephone call
US7657020B2 (en) 2005-06-03 2010-02-02 At&T Intellectual Property I, Lp Call routing system and method of using the same
US20070047726A1 (en) * 2005-08-25 2007-03-01 Cisco Technology, Inc. System and method for providing contextual information to a called party
US8874477B2 (en) 2005-10-04 2014-10-28 Steven Mark Hoffberg Multifactorial optimization system and method
US8243895B2 (en) * 2005-12-13 2012-08-14 Cisco Technology, Inc. Communication system with configurable shared line privacy feature
US7925975B2 (en) 2006-03-10 2011-04-12 Microsoft Corporation Searching for commands to execute in applications
US8300798B1 (en) 2006-04-03 2012-10-30 Wai Wu Intelligent communication routing system and method
US20070286358A1 (en) * 2006-04-29 2007-12-13 Msystems Ltd. Digital audio recorder
US7761110B2 (en) * 2006-05-31 2010-07-20 Cisco Technology, Inc. Floor control templates for use in push-to-talk applications
US8345851B2 (en) * 2006-05-31 2013-01-01 Cisco Technology, Inc. Randomized digit prompting for an interactive voice response system
US8234120B2 (en) * 2006-07-26 2012-07-31 Nuance Communications, Inc. Performing a safety analysis for user-defined voice commands to ensure that the voice commands do not cause speech recognition ambiguities
US20080072139A1 (en) * 2006-08-20 2008-03-20 Robert Salinas Mobilizing Webpages by Selecting, Arranging, Adapting, Substituting and/or Supplementing Content for Mobile and/or other Electronic Devices; and Optimizing Content for Mobile and/or other Electronic Devices; and Enhancing Usability of Mobile Devices
US8386248B2 (en) * 2006-09-22 2013-02-26 Nuance Communications, Inc. Tuning reusable software components in a speech application
US20080091612A1 (en) * 2006-10-17 2008-04-17 Kirk Joseph Witecha Telephone communication system and methods
US8687785B2 (en) 2006-11-16 2014-04-01 Cisco Technology, Inc. Authorization to place calls by remote users
EP1933302A1 (en) * 2006-12-12 2008-06-18 Harman Becker Automotive Systems GmbH Speech recognition method
US8831183B2 (en) * 2006-12-22 2014-09-09 Genesys Telecommunications Laboratories, Inc Method for selecting interactive voice response modes using human voice detection analysis
US9497205B1 (en) 2008-05-19 2016-11-15 Emc Corporation Global commonality and network logging
US8577680B2 (en) * 2006-12-30 2013-11-05 Emc Corporation Monitoring and logging voice traffic on data network
US9152706B1 (en) 2006-12-30 2015-10-06 Emc Corporation Anonymous identification tokens
US20080159146A1 (en) * 2006-12-30 2008-07-03 Emc Corporation Network monitoring
WO2008082564A2 (en) * 2006-12-30 2008-07-10 Emc Corporation Network monitoring
US8139755B2 (en) 2007-03-27 2012-03-20 Convergys Cmg Utah, Inc. System and method for the automatic selection of interfaces
US8817061B2 (en) * 2007-07-02 2014-08-26 Cisco Technology, Inc. Recognition of human gestures by a mobile phone
US8457839B2 (en) * 2010-01-07 2013-06-04 Ford Global Technologies, Llc Multi-display vehicle information system and method
US8675842B2 (en) * 2010-03-30 2014-03-18 Verizon Patent And Licensing Inc. Speech usage and performance tool
US9639688B2 (en) 2010-05-27 2017-05-02 Ford Global Technologies, Llc Methods and systems for implementing and enforcing security and resource policies for a vehicle
US8645136B2 (en) 2010-07-20 2014-02-04 Intellisist, Inc. System and method for efficiently reducing transcription error using hybrid voice transcription
US20120041633A1 (en) 2010-08-16 2012-02-16 Ford Global Technologies, Llc Systems and methods for regulating control of a vehicle infotainment system
US8559932B2 (en) 2010-12-20 2013-10-15 Ford Global Technologies, Llc Selective alert processing
US9452735B2 (en) 2011-02-10 2016-09-27 Ford Global Technologies, Llc System and method for controlling a restricted mode in a vehicle
US8522320B2 (en) 2011-04-01 2013-08-27 Ford Global Technologies, Llc Methods and systems for authenticating one or more users of a vehicle communications and information system
US8914290B2 (en) 2011-05-20 2014-12-16 Vocollect, Inc. Systems and methods for dynamically improving user intelligibility of synthesized speech in a work environment
US8788113B2 (en) 2011-06-13 2014-07-22 Ford Global Technologies, Llc Vehicle driver advisory system and method
US8849519B2 (en) 2011-08-09 2014-09-30 Ford Global Technologies, Llc Method and apparatus for vehicle hardware theft prevention
US9569403B2 (en) 2012-05-03 2017-02-14 Ford Global Technologies, Llc Methods and systems for authenticating one or more users of a vehicle communications and information system
US9691377B2 (en) 2013-07-23 2017-06-27 Google Technology Holdings LLC Method and device for voice recognition training
US9688246B2 (en) 2013-02-25 2017-06-27 Ford Global Technologies, Llc Method and apparatus for in-vehicle alarm activation and response handling
US8947221B2 (en) 2013-02-26 2015-02-03 Ford Global Technologies, Llc Method and apparatus for tracking device connection and state change
US10297250B1 (en) * 2013-03-11 2019-05-21 Amazon Technologies, Inc. Asynchronous transfer of audio data
US9275638B2 (en) 2013-03-12 2016-03-01 Google Technology Holdings LLC Method and apparatus for training a voice recognition model database
US9141583B2 (en) 2013-03-13 2015-09-22 Ford Global Technologies, Llc Method and system for supervising information communication based on occupant and vehicle environment
US8909212B2 (en) 2013-03-14 2014-12-09 Ford Global Technologies, Llc Method and apparatus for disclaimer presentation and confirmation
US9002536B2 (en) 2013-03-14 2015-04-07 Ford Global Technologies, Llc Key fob security copy to a mobile phone
US8862320B2 (en) 2013-03-14 2014-10-14 Ford Global Technologies, Llc Method and apparatus for ambient lighting incoming message alert
US9978395B2 (en) 2013-03-15 2018-05-22 Vocollect, Inc. Method and system for mitigating delay in receiving audio stream during production of sound from audio stream
US9548047B2 (en) 2013-07-31 2017-01-17 Google Technology Holdings LLC Method and apparatus for evaluating trigger phrase enrollment
CN104683557A (zh) * 2013-12-02 2015-06-03 中兴通讯股份有限公司 一种移动终端自动切换通话模式的方法及装置
US10249123B2 (en) 2015-04-09 2019-04-02 Ford Global Technologies, Llc Systems and methods for mobile phone key fob management
US9691378B1 (en) * 2015-11-05 2017-06-27 Amazon Technologies, Inc. Methods and devices for selectively ignoring captured audio data
US10714121B2 (en) 2016-07-27 2020-07-14 Vocollect, Inc. Distinguishing user speech from background speech in speech-dense environments
US10607601B2 (en) * 2017-05-11 2020-03-31 International Business Machines Corporation Speech recognition by selecting and refining hot words
US20180330718A1 (en) * 2017-05-11 2018-11-15 Mitsubishi Electric Research Laboratories, Inc. System and Method for End-to-End speech recognition
CN113670643B (zh) * 2021-08-30 2023-05-12 四川虹美智能科技有限公司 智能空调测试方法及系统

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1056504A (en) * 1975-04-02 1979-06-12 Visvaldis A. Vitols Keyword detection in continuous speech using continuous asynchronous correlation
US4761807A (en) * 1982-09-29 1988-08-02 Vmx, Inc. Electronic audio communications system with voice authentication features
US4935954A (en) * 1988-12-28 1990-06-19 At&T Company Automated message retrieval system
US5127055A (en) * 1988-12-30 1992-06-30 Kurzweil Applied Intelligence, Inc. Speech recognition apparatus & method having dynamic reference pattern adaptation
JP2927891B2 (ja) * 1989-06-19 1999-07-28 日本電気株式会社 音声ダイヤル装置
US5226090A (en) * 1989-12-29 1993-07-06 Pioneer Electronic Corporation Voice-operated remote control system
JP2964518B2 (ja) * 1990-01-30 1999-10-18 日本電気株式会社 音声制御方式
US5204894A (en) * 1990-11-09 1993-04-20 Bell Atlantic Network Services, Inc. Personal electronic directory
US5276872A (en) * 1991-06-25 1994-01-04 Digital Equipment Corporation Concurrency and recovery for index trees with nodal updates using multiple atomic actions by which the trees integrity is preserved during undesired system interruptions
WO1993013518A1 (en) * 1991-12-31 1993-07-08 Digital Sound Corporation Voice controlled messaging system and processing method
AU664105B2 (en) * 1992-06-15 1995-11-02 British Telecommunications Public Limited Company Service platform
US5406618A (en) * 1992-10-05 1995-04-11 Phonemate, Inc. Voice activated, handsfree telephone answering device
US5717738A (en) * 1993-01-11 1998-02-10 Texas Instruments Incorporated Method and device for generating user defined spoken speed dial directories
US5452340A (en) * 1993-04-01 1995-09-19 Us West Advanced Technologies, Inc. Method of voice activated telephone dialing
US5602963A (en) * 1993-10-12 1997-02-11 Voice Powered Technology International, Inc. Voice activated personal organizer
FR2711872B1 (fr) * 1993-10-21 1996-02-09 Jean Pierre Talvard Appareil portatif indépendant formant annuaire et composeur téléphonique.
US5566272A (en) * 1993-10-27 1996-10-15 Lucent Technologies Inc. Automatic speech recognition (ASR) processing using confidence measures
US5493608A (en) * 1994-03-17 1996-02-20 Alpha Logic, Incorporated Caller adaptive voice response system
WO1995027360A1 (en) * 1994-03-31 1995-10-12 Citibank, N.A. Interactive voice response system
US5708704A (en) * 1995-04-07 1998-01-13 Texas Instruments Incorporated Speech recognition method and system with improved voice-activated prompt interrupt capability
US5684869A (en) * 1995-12-27 1997-11-04 Lucent Technologies, Inc. Telephone station remote access device and method
US5719921A (en) 1996-02-29 1998-02-17 Nynex Science & Technology Methods and apparatus for activating telephone services in response to speech
US5999611A (en) * 1996-11-19 1999-12-07 Stentor Resource Centre Inc. Subscriber interface for accessing and operating personal communication services
DE69839087T2 (de) 1998-03-18 2009-03-19 Sony Deutschland Gmbh IRC Namenübersetzungsprotokoll

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7260534B2 (en) 2002-07-16 2007-08-21 International Business Machines Corporation Graphical user interface for determining speech recognition accuracy
JP2008511256A (ja) * 2004-08-26 2008-04-10 エーティー アンド ティー ナレッジ ベンチャーズ エル.ピー. スピーチにより可能とされたコールセンター環境において自動化されたコールルーティング応用を実行する方法、システム、およびソフトウェア
US8090083B2 (en) 2004-10-20 2012-01-03 Microsoft Corporation Unified messaging architecture
JP2006268832A (ja) * 2005-03-22 2006-10-05 Microsoft Corp 選択可能な状態機械ユーザインターフェースシステム
JP2012516636A (ja) * 2009-01-29 2012-07-19 フォード グローバル テクノロジーズ、リミテッド ライアビリティ カンパニー 無線通信リンク上で次の入力を合図するために、指示プロンプトを中断するシステムと方法
JP2016505897A (ja) * 2013-01-04 2016-02-25 コピン コーポレーション 二分岐音声認識

Also Published As

Publication number Publication date
US6522726B1 (en) 2003-02-18
US6385304B1 (en) 2002-05-07
CA2233019C (en) 2003-01-14
EP0867861A3 (en) 1999-08-11
US6539078B1 (en) 2003-03-25
CA2233019A1 (en) 1998-09-24
US6377662B1 (en) 2002-04-23
EP0867861A2 (en) 1998-09-30
US6094476A (en) 2000-07-25

Similar Documents

Publication Publication Date Title
JPH1188502A (ja) 音声応答メッセージング方法および装置
US9787830B1 (en) Performing speech recognition over a network and using speech recognition results based on determining that a network connection exists
US8447599B2 (en) Methods and apparatus for generating, updating and distributing speech recognition models
AU667871B2 (en) Voice controlled messaging system and processing method
US20050080627A1 (en) Speech recognition device
US7668710B2 (en) Determining voice recognition accuracy in a voice recognition system
US6574601B1 (en) Acoustic speech recognizer system and method
EP0890249B1 (en) Apparatus and method for reducing speech recognition vocabulary perplexity and dynamically selecting acoustic models
US5452340A (en) Method of voice activated telephone dialing
US6438520B1 (en) Apparatus, method and system for cross-speaker speech recognition for telecommunication applications
US6629071B1 (en) Speech recognition system
US6744860B1 (en) Methods and apparatus for initiating a voice-dialing operation
US8401846B1 (en) Performing speech recognition over a network and using speech recognition results
US20030125947A1 (en) Network-accessible speaker-dependent voice models of multiple persons
EP1151431B1 (en) Method and apparatus for testing user interface integrity of speech-enabled devices
EP1385148B1 (en) Method for improving the recognition rate of a speech recognition system, and voice server using this method
JP2000125006A (ja) 音声認識装置、音声認識方法、及び電話自動応答装置
JPH09212186A (ja) 音声認識方法およびこの方法を実施する装置