JPH09505710A

JPH09505710A - 自動電話番号案内方法および装置

Info

Publication number: JPH09505710A
Application number: JP7526586A
Authority: JP
Inventors: ベルビー・グレゴリー・ジェイ; グプタ・ヴィシュワ・エヌ; ホッグソン・ローレン・スィー; レニグ・マシュー; シャープ・アール・ダグラス; ワスメイヤー・ハンス・エー
Original assignee: ノーザン・テレコム・リミテッド
Priority date: 1994-04-14
Filing date: 1994-06-17
Publication date: 1997-06-03
Also published as: EP0757868B1; EP0757868A1; CA2185356C; DE69420865T2; US5644680A; CA2185356A1; DE69420865D1; US5488652A; WO1995028790A1

Abstract

(57)【要約】少なくとも部分的に電話番号案内を自動化する方法および装置において、電話番号案内の利用者は、地域名あるいは所望の電話番号記載事項に関連する問い合わせエントリ名を発声するように誘導される。音声認識アルゴリズムを適用して、この誘導に応答して利用者から受信した音声信号から、利用者の述べた地域または問い合わせエントリ名を決定する。利用者の所望の電話番号が検索されると、その電話番号を使用して、地域あるいは問い合わせエントリ名の少なくともいくつかが確認される。確認済みまたは訂正された名前のラベルを付された音声信号の表示は、ラベルを付した音声トークンとして使用され、音声認識アルゴリズムのトレーニングに先だって精度の高いものにされる。トレーニングを精度の高いものにすることによって、今までの音声認識アルゴリズムにみられた欠陥に対して、特定の番号案内装置によってサービスされる番号案内利用者の音声パターンの長期的変化を自動的に調整する。本方法は、他の音声認識に適用されるように一般化することができる。

Description

【発明の詳細な説明】発明の名称自動電話番号案内方法および装置発明の分野本発明は話者の要求に対し自動的に応答する方法および装置に関するものであり、特に、話者の要求する情報を自動的に提供する方法および装置に関するものである。本発明は例えば、電話番号案内機能を部分的あるいは全体的に自動化するために用いられる。発明の背景電話会社は、印刷された電話番号帳を提供する他に電話番号案内サービスを行っている。これらサービスの利用者は、所定の電話番号に電話をかけると番号案内オペレータにつながり、オペレータは電話番号データベースにアクセスし、利用者の要求する番号を検索して利用者に知らせる。電話会社が一年に扱う番号案内サービスの数は相当なものであり、このサービスに要する人件費が非常にかさむことになる。従って、電話会社および電話機生産者は電話番号案内サービスの提供にかかる人件費を減らすようなシステムの構築に多大な労力を費やしている。一般的な電話番号案内サービスでは、オペレータはまず、利用者が電話番号を問い合わせたい人または組織の地域を利用者に尋ねる。ここで、利用者の問い合わせたい地域がオペレータの電話番号帳にリストされていないものであると、オペレータは問い合わせた地域を扱っている他の電話番号案内サービスの電話番号を利用者に知らせる。利用者の問い合わせたい地域がオペレータの電話番号帳にリストされていれば、オペレータは利用者が電話番号を問い合わせ先の組織の名前を尋ねる。オペレータは電話番号の問い合わせ先の人または組織に対応するリスト記載事項を含む電話番号データベースを検索してそのリスト記載事項を探し当て、そのリスト記載事項の電話番号を利用者に知らせる。電話番号案内サービスの提供にかかる人件費は、人間のオペレータによって行われていた機能を部分的あるいは全体的に自動化することで削減できる。米国特許第４，９７９，２０６は、電話番号案内オペレータの機能を自動化する自動音声認識システムを開示している。このような電話番号案内の利用者は、所望のリスト記載事項を呼びだすために、地域と電話番号を問い合わせたい人または組織の名前を一字づつ綴るように自動的に誘導される。自動音声認識システムは利用者の音声応答に対して文字列からなる名前を認識し、認識された文字列の名前シーケンスから、所望の地域、人または組織の名前を認識する。所望のリスト記載事項を含む電話番号データベースが自動的に検索され、所望のリスト記載事項が探し当てられると、そのリスト記載事項の電話番号が利用者に自動的に知らされる。さらに、自動音声認識システムは利用者をその電話番号に接続する。ここで、自動音声認識システムが音声された文字列からなる名前を認識できないとき、あるいは、適切なリスト記載事項を探し当てられないときは、利用者は人間オペレータに接続され、上記の通常の方法で番号案内を行う（１９９０年１２月８日に発行されたF．W．Padden et al，米国特許第４，９７９，２０６、「電話番号案内システム」）。米国特許第４，９７９，２０６に開示された電話番号案内システムの音声認識システムが認識する語葉は５０以下である（２６文字の名前、１０桁の名前、「はい」と「いいえ」）。このような限られた認識語彙の使用により音声認識装置の設計とトレーニングが簡略化されるが、電話番号案内システムは利用者にとって使いにくく時間のかかるものとなる。必要な情報を一字づつ綴らなくてはならない不便さから、利用者のなかには自動電話番号案内システムの使用を避けて、人間オペレータに接続するようにシステムを使用するために、人件費削減のための自動化が無駄になる。 Lennig et alが開示する自動電話番号案内システムは音声認識システムに基づくものであり、その認識語彙は、ある場所に位置する電話番号案内の利用者が要求すると思われるほとんどの地域名といくつかの組織名を含むことができる（１９９２年１０月，Piscataway，Ｎ．Ｊ．の遠距離通信への応用のための双方向音声技術に関するＩＥＥＥワークショップ会誌，"AUTOMATED BILINGUAL DIRECTORY ASSISTANCE TRIAL IN BELL CANADA"）。この音声認識システムはフレキシブル語彙認識（ＦＶＲ）技術を使用し、１９９２年１０月，Piscataway，Ｎ．Ｊ．遠距離通信への応用のための双方向音声技術に関するＩＥＥＥワークショップ会誌， "FLEXIBLE VOCABULARY RECOGNITION OF SPEECH OVER THE TELEPHONE"や、１９９３年Telesis No.97，２２〜３３頁の"UNLEASHING THE POTENTIAL OF HUMAN-TO-M ACHINE COMMUNICATION" に開示されている技術と同様のものであり、これにより認識語彙の拡張が達成される。これら刊行物は参照により本明細書中に記載されている。 Lennig et alが開示する音声認識システムにより利用者が自然に話すように地域名、組織名が認識されるので、利用者はこれらの名前を一字づつ綴ることなく要求する電話番号を得ることができる。この程度まで便利になれば、電話番号案内システムを利用する利用者は増え、人件費削減の効果は大きい。しかし、実際の電話網でLennig et alの開示する電話番号案内システムを実行するには、電話番号案内システムの利用者が要求すると思われる全ての地域名といくつかの組織名をかなり正確に認識するように自動音声認識システムを「トレーニング」しなくてはならない。このようなトレーニングを行うには、その地域の人が言う地域名と組織名をいくつも録音しなくてはならず、さらに各録音（あるいは「音声トークン」）にラベルを付して特定の地域あるいは組織名に対応させなくてはならない。自動音声認識システムをトレーニングするには、おおよそ２００００のラベルを付した音声トークンが必要となり、これによって電話番号案内で地域名、組織名が適切に認識される。このおおよそ２００００の音声トークンを集めてラベルを付すには、一般に熟練した音声専門家であっても数週間を必要とする。このような比較的大きな音声トークンのサンプルでトレーニングを行った後、さらに地域の人々から集められラベルを付された音声トークンを追加することで音声認識システムの性能は向上する。さらに、電話番号案内システムが利用される地域の音声形態が時間の経過と共に変遷するので、当初はよくトレーニングされ地域の人々によって話された地域名をよく認識する音声認識システムであっても時を経れば性能が低下する。そのため、地域の音声形態の変化に対応するように音声認識システムを定期的に再トレーニングしなくてはならない。従って、電話番号案内に利用される音声認識システムのトレーニングは多大なコストと時間を費やすものとなる。発明の開示本発明の第１の目的は、音声認識システムを電話番号案内サービスの提供および他の用途へ利用するためにトレーニングを行うに要する時間と費用を削減することにある。本発明の他の目的は、自動電話番号案内システムおよび他の用途に用いられる音声認識システムの性能を長期的に向上させることにある。本発明の第１の見地によれば、本発明は電話番号案内システム機能を少なくとも部分的に自動化する方法を提供する。本方法によれば、電話番号案内の利用者は所望の電話番号記載事項に関する名前を発音するように誘導される。利用者が問い合わせた電話番号は、誘導に従って利用者から得られた音声信号に基づいて決定される。所望の電話番号が決定されると検索が始まる。検索された電話番号は、パラメータ変更アルゴリズム中で使用され、自動的に音声認識アルゴリズムのパラメータを変更する。簡単な実施例を挙げると、検索された電話番号は単純にアプリオリ（先験的）な確率モデルに対するモデルパラメータの計算に使用される。アプリオリな確率モデルは、特定地域のリスト記載事項に対する電話番号を利用者が要求する確率を利用者の電話番号の関数として推定したものである。このアプリオリ・モデルは、利用者がリスト記載事項を要求する際に発声される地域名を認識するための音声認識アルゴリズムにおいて、音声信号の音響パラメータにもとづく決定を重みづけするために使用される。このように検索された電話番号を使用してアプリオリ・モデルを精緻なものにすることで、特定の電話番号案内に利用される音声認識アルゴリズムの性能が向上する。より高度な実施例を挙げると、誘導に従って利用者から受信された音声信号の表示が記憶され、各々の記憶された音声信号表示は検索される電話番号と関連づけされる。対応地域名または利用者が呼び出すエントリ名は検索された電話番号から作成され、音声認識アルゴリズムはその作成された名前の中で音声信号の表示にもっとも合致すると思われる名前を決定する。このようにして作成された名前と記憶された音声信号の表示が対応する確率が高いと、記憶された表示にはその作成された名前のラベルが付され、ラベルが付された音声トークンとして音声認識アルゴリズムのトレーニングの更新に使用される。ラベルを付された音声トークンは、音声認識アルゴリズムにおける隠れマルコフモデルのパラメータ、アプリオリ・モデルのパラメータ、受理基準確率モデルのパラメータ、および受理基準閾値の計算に使用される。すなわち、検索された電話番号は、音声認識アルゴリズムによって認識された地域あるいは呼び出されたエントリ名の少なくともいくつかを確認し、訂正するために用いられる。パラメータ変更アルゴリズムは、確認あるいは訂正された名前に対応するラベル付き音声トークンを用いることで、音声認識アルゴリズムのトレーニングを更新する。結果として、この方法により従来の音声認識アルゴリズムにみられたトレーニングの欠陥が補われ、特定の電話番号案内装置の利用者の長期的な音声形態の変化に対して自動調整が行われる。この方法は、従来の音声認識アルゴリズムのトレーニングの欠陥に対して自動調整を行うものであるため、音声認識アルゴリズムのトレーニングの際により少ない初期投資で、自動電話番号案内システムの設置が行われる。また、音声認識アルゴリズムのトレーニングをさらに行う際にも完全に自動化されるため、従来の音声専門家によるトレーニングに比べてコスト、効率面でも比較的優れている。この発明の法則を一般化することで、音声認識を用いた他の自動システムへ応用することも可能である。従って、本発明の他の見地によれば、本発明は音声信号に対してふさわしい応答をする方法を提供することにある。本方法は、音声信号の表示を記憶し、その音声信号の表示に応答する音声認識アルゴリズムに従って、音声信号が動作語彙中の複数の動作の各々に一致する確率の測度を計算する。動作語彙からの動作は計算された確率の測度に従って選択され自動的に実行される。所望の動作がさらにデータ表示され、動作に一致する音声信号の確率の測度が、音声信号の表示およびさらに得られたデータの双方に対する音声認識アルゴリズムに従ってさらに計算される。記憶された音声信号の表示は、さらに計算された確率の測度にしたがってラベルが付され、音声認識アルゴリズムモデルパラメータが、そのラベルを付され記憶された音声信号表示に対して計算される。このような選択動作として、電話番号案内に利用されるように、所望の情報のうちの選択されたアイテムのみを提供したり、他の動作、例えば、音声駆動タイプライタに適用して発音された言葉をタイプすることが含まれる。このような選択動作において、所望の動作を表示する音声信号をさらに提供するように利用者を誘導し、さらにデータが得られれば、得られた音声信号に対する音声認識アルゴリズムに従って、音声信号が複数の動作の各々に対応する確率の測度が計算される。従って適当な論理構造を有する誘導形式を用いて、一連の論理ステップにおける所望の動作を決定することができる。利用者は、以前に分析された音声信号に従って選択された所望の動作の確認あるいは取り消しを行うように誘導される。この誘導は、以前分析された音声信号に従い、選択された特定の動作によって選択的に行われる。すなわち、音声認識アルゴリズムがすでに高い確率で認識されると知られている語彙アイテムについては、利用者に不当な手間をかけたり不必要なデータトレーニング処理を行うことがないように、確認を行わない。以前分析された音声信号に従って選択された特定の動作をオペレータ主導で取り消す場合、例えば、音声による取り消しや、選択動作の手動取り消しを行う場合もモニタされ、さらに所望の動作を表わすデータとして用いられる。本発明の他の見地によれば、本発明は電話番号案内を少なくとも部分的に自動化する装置を提供する。本装置には、少なくとも部分的に案内問い合わせを処理するオンラインプロセッサを含む。オンラインプロセッサは、利用者が問い合わせる電話番号一覧を呼び出すために名前を発声するように利用者を誘導し、誘導に従って利用者より受信された音声信号の表示を問い合わせ記録に記録し、電話番号案内データベースより検索された電話番号を問い合わせ記録に記録して各々の記憶された音声表示と検索された電話番号を関連づける。本装置にはさらに、オンラインプロセッサによる問い合わせ記録を処理するためのオフラインプロセッサが含まれる。オフラインプロセッサは、問い合わせ記録に記録され検索された電話番号に応答する音声認識アルゴリズムのパラメータを変更する。オフラインプロセッサは、各々の検索された電話番号から、それに対応する名前を作成するために、名前／番号データベースを検索し、音声認識アルゴリズムを実行して選択され作成された名前と選択され記録された音声信号表示を関連づける。オフラインプロセッサは選択された音声信号表示とそれに関連する名前をラベルを付された音声トークンとして使用し、音声認識アルゴリズムのトレーニングがそのパラメータ変更によって行われる。オフラインプロセッサは変更された音声認識アルゴリズムパラメータをメモリへダウンロードし、オンラインプロセッサは、電話番号案内を行う際にそのメモリにアクセスする。本装置にはさらに、オンラインプログラム、問い合わせ記録、およびオンライン音声認識モデルパラメータを記憶するオンラインメモリとオフラインプログラム、トレーニング記録、名前／番号データベースおよびオフライン音声認識モデルパラメータを記憶するオフラインメモリが含まれる。問い合わせ記録はオフラインプロセッサが読み出し可能なものであり、オンライン音声認識モデルパラメータはオフラインプロセッサが書き込み可能なものでなくてはならない。本装置にはさらに、オンラインプロセッサをそれぞれ交換電話網のスイッチに接続するスイッチインタフェースおよび電話番号案内データベースに接続する電話番号案内データベースインタフェースが含まれる。オペレータ台コントローラは、スイッチインタフェースおよびスイッチを介してオンラインプロセッサに接続され、スイッチを介して電話番号案内データベースに接続される。オペレータ台コントローラには、一つまたはそれ以上のオペレータ台が接続される。音声応答ユニットは、電話番号案内データベースおよびスイッチに接続され、電話番号案内利用者に対して電話番号一覧の電話番号が聞き取れるように電話番号を発声する。図面の簡単な説明以下に本発明の実施の形態を、適宜添付の図面を参照しながら例をあげて記載する。図１は、本発明の実施例による電話番号案内自動化システムを含む電話網の概要ブロック図を示す。図２は、図１の電話番号案内自動化システムの概要ブロック図を示す。図３は、電話番号案内呼を扱う図２の電話番号案内自動化システムの動作を示すフローチャートである。図４Ａ、図４Ｂは、図２の電話番号案内自動化システムに使用される音声認識アルゴリズムの主要なステップを示すフローチャートである。図５Ａ、図５Ｂは、図４Ａ、図４Ｂの音声認識アルゴリズムに使用される受理基準の適用を示すフローチャートである。図６Ａ、図６Ｂは、自動的にトレーニング記録を作り出す図２の電話番号案内自動化システムの動作を示すフローチャートである。図７は、図４Ａ、図４Ｂの音声認識アルゴリズムに使用される異音隠れマルコフモデル（ＨＭＭ）のトレーニングを行う図２の電話番号案内自動化システムの動作を示すフローチャートである。図８は、図４Ａ、図４Ｂの音声認識アルゴリズムに使用されるアプリオリ・モデルのトレーニングを行う図２の電話番号案内自動化システムの動作を示すフローチャートである。図９は、図５Ａ、図５Ｂの受理基準の適用に使用される確率関数のトレーニングを行う図２の電話番号案内自動化システムの動作を示すフローチャートである。図１０Ａ、図１０Ｂは、音声認識アルゴリズムのテストを行う図２の電話番号案内自動化システムの動作を示すフローチャートである。図１１は、名前語彙の中のある名前に偽（デコイ）としてラベルを付す図２の電話番号案内自動化システムの動作を示すフローチャートである。発明の詳細な説明図１は、電話番号案内自動システム１００を含む、本発明の一実施例による電話網を示す概要ブロック図である。電話番号案内自動システム１００は、公衆交換電話網（ＰＳＴＮ）のディジタルスイッチ２００に接続される。電話番号案内の利用者は、特定の電話番号案内番号を各自の局装置３００上でダイヤルし、ＰＳＴＮのスイッチ２００を介して電話番号案内自動システム１００に接続される。電話番号案内自動システム１００は、ディジタルスイッチ２００を介してオペレータ台コントローラ４００に接続される。オペレータ台コントローラ４００は、いくつかのオペレータ台５００を制御する。オペレータ台５００上のオペレータは、電話番号案内データベース６００にオペレータ台コントローラ４００およびディジタルスイッチ２００を介してアクセスする。電話番号案内データベース６００は、音声応答ユニット（ＡＲＵ）７００に接続され、音声応答ユニット７００は、さらにディジタルスイッチ２００に接続される。電話番号案内自動システム１００は、電話番号案内データベース６００に直接接続される。図２は、電話番号案内自動システム１００をより詳細に示す概要図である。電話番号案内自動システム１００は、オンラインプロセッサ１１０、オフラインプロセッサ１２０、２つのインタフェース１３０、１４０およびオンラインメモリ１５０、オフラインメモリ１６０に組み込まれたメモリを含む。オンラインプロセッサ１１０はディジタルスイッチ２００にスイッチインタフェース１３０を介して接続され、電話番号案内データベースインタフェース１４０を介して電話番号案内データベース６００に接続される。オンラインプロセッサ１１０はオンラインメモリ１５０のオンラインプログラム領域１５２に記憶されたインストラクションを実行し、スイッチインタフェース１３０および電話番号案内データベースインタフェース１４０を介して受信された信号を処理し、問い合わせ記録を作成し、その問い合わせ記録はオンラインメモリ１５０の問い合わせ記録領域１５４に記憶される。オンラインプロセッサ１１０によって実行されるインストラクションのいくつかは、音声認識モデルパラメータを必要とし、そのパラメータは、オンラインメモリ１５０のオンラインモデルパラメータ領域１５６に記憶される。図３は、電話番号案内呼を受信した際のオンラインプロセッサ１１０の動作を示すフローチャートである。利用者は局３００に電話番号案内番号をダイアルすると、ＰＳＴＮのディジタルスイッチ２００によって電話番号案内自動システム１００に接続される。オンラインプロセッサ１１０は、スイッチインタフェース１３０を介してディジタルスイッチ２００から問い合わせ番号を受信し、問い合わせ時刻を計算し、オンラインメモリ１５０の問い合わせ記録領域１５４の問い合わせ記録を開いて、問い合わせ番号のＮＰＡ−ＮＸＸ部分と問い合わせ時刻を問い合わせ記録に記録する。オンラインプロセッサ１１０は、オンラインメモリ１５０内のオンラインプログラム領域１５２に記憶されたインストラクションを実行し、利用者に音声で問い合わせ人または組織の地域名を告げるように誘導する。スイッチインタフェース１３０を介して音声信号が利用者から受信されると、オンラインプロセッサ１１０は、音声信号を記憶し、オンラインメモリ１５０のオンラインプログラム領域１５２に記憶されたインストラクションを実行し、音声処理アルゴリズムに従って記憶された音声信号を処理する。これによって、音声認識アルゴリズムへの入力に適した音声信号の表示が得られる。オンラインプロセッサ１１０は、問い合わせ記録の表示を記録し、オンラインプログラム領域１５２に記憶されたインストラクションをオンラインモデルパラメータ領域１５６に記憶されたモデルパラメータに基づいてさらに実行し、音声認識アルゴリズムを音声信号表示に適用する。これによって、音声信号が地域名ボキャブラリの各名前に一致する確率の測度が計算される。オンラインプロセッサ１１０は、確率の測度が高い上位３０の地域名に対応する問い合わせ記録の索引を記録する。オンラインプロセッサ１１０は、さらに音声認識のための計算を行う。この計算は、計算された確率の測度に基づく受理基準を適用し、高い確率測度を有する地域名の認識を行って良いかどうかの判断をするものであり、後に詳しく述べられる。オンラインプロセッサ１１０は、オンラインメモリ１５０のオンラインプログラム領域１５２に記憶されたインストラクションをさらに実行し、利用者が電話をかけたい人あるいは組織の名前（すなわち「問い合わせエントリ名」）を含む他の情報をさらに告げるように、利用者を誘導する。スイッチインタフェース１３０を介して利用者からさらに音声信号が受信されると、オンラインプロセッサ１１０は、その音声信号を記憶する。これらのステップは、発明を理解する際に重要ではないので、簡略化のため図３のフローチャートでは省略されている。オンラインプロセッサ１１０は、電話番号案内自動システム１００として機能する電話番号案内データベースインタフェース１４０、電話番号案内データベース６００およびディジタルスイッチ２００を介して、オペレータ台５００に接続するように要求する。オンラインプロセッサ１１０が電話番号案内データベースインタフェース１４０から接続完了の情報を受け取ると、オンラインプロセッサ１１０は、（もしあるのであれば）認識した地域名を示す信号を、電話番号案内データベースインタフェース１４０を介して、電話番号案内データベース６００に送信する。電話番号案内データベース６００は、オペレータ台５００に対して、認識した地域名を含む情報を表示する適当なスクリーンを表示する。いかなる地域名も認識されない場合は、オペレータ台コントローラ４００は、電話番号案内データベース６００に、オペレータ台５００に対しては情報が欠陥であるとの表示を行わせる。オンラインプロセッサ１１０は、スイッチインタフェース１３０およびスイッチ２００を介してオペレータ台コントローラ４００に記憶された音声信号を送信し、利用者の発した地域名をオペレータに対して音声で再生し、オペレータが地域名を認識できるようにする。オンラインプロセッサ１１０は、さらに記憶された音声信号についても、スイッチインタフェース１３０およびスイッチ２００を介してオペレータ台コントローラ４００に送信し、利用者の発した問い合わせエントリ名をオペレータに対して音声で再生し、オペレータが電話番号案内データベース６００内の必要なリスト記載事項を探し当てられるようにする。このステップは、発明を理解する際に重要ではないので、簡略化のため図３のフローチャートでは省略されている。オペレータ台コントローラ４００は、スイッチ２００を介してオペレータ、利用者間の音声リンクを完了させ、利用者がどのような特殊な電話番号を求めているのかを決定する際に必要となる情報を、さらにオペレータが要求し受け取ることができるようにする。ここで、いかなる地域名も認識されないと、オペレータは、利用者にさらに質問をして地域名を訂正し、正しい地域名をオペレータ台に入力する。オペレータは、オペレータ台コントローラ４００およびスイッチ２００を介して、電話番号案内データベース６００にアクセスし、利用者が要求したこの特殊な電話番号を決定するのに必要な電話番号情報をすべてオペレータ台５００に表示する。オペレータは、利用者の要求する電話番号を選択して、問い合わせ電話から切り離す。オペレータ台コントローラ４００は、電話番号案内データベース６００に対して、自動的にＡＲＵ７００を介して利用者が要求する電話番号を利用者に知らせるよう指示する。（この様な機能を有する電話番号案内データベース装置およびオペレータ台コントローラは、製品化されている。例えば、ノーザンテレコムＤＭＳ−２００ＴＰＳ、ディジタル電話番号・アシスタンス（ＤＤＡ）あるいはディレクトリ・ワンのようなデータベース製品は、このような機能を有するように設計されている。尚、ＤＭＳ、ＴＯＰＳ、ＤＤＡおよびディレクトリ・ワンはノーザン・テレコム・リミテッドの商標である。）電話番号案内データベース６００は、検索された電話番号と、電話番号案内データベースインタフェース１４０を介してオンライン検索された地域名を送信する。オンラインプロセッサ１１０は、検索された電話番号のＮＰＡ−ＮＸＸ部分と検索された地域名を、問い合わせ記録に記憶する。（ここで、検索された地域名は、電話番号が検索される時に、検索スクリーン上に現れる地域名である。）ここで、音声認識アルゴリズムが地域名を認識すると、検索された地域名は、オペレータが手動で地域名の訂正を入力しないかぎり、音声認識アルゴリズムによって認識された地域名である。ここで、音声認識アルゴリズムが地域名の認識に失敗すると、検索された地域名は、利用者に電話番号が知らされる前にオペレータによって入力された地域名となる。オンラインプロセッサ１１０は、スイッチインタフェース１３０を介して、ディジタルスイッチ２００に対して問い合わせ電話が完了したとの信号を発し、次の電話番号案内呼を待ち受ける。電話番号案内自動システム１００が利用者が要求した電話番号の地域を正確に認識することができると、オペレータが利用者に地域名を問う時間、地域名を入力する時間、電話番号案内データベース６００から情報を表示するのに適当なスクリーンを呼び出す時間を省くことができる。万が一、電話番号案内自動システム１００が地域名を間違って認識した場合、オペレータがその間違いを認識し訂正する時間がかかってしまう。総計でオペレータの負担を軽くするには、電話番号案内自動システム１００は、高い確率（一般には、７５％以上の確率）で正しい認識を行ない、認識の失敗の確率はかなり低いもの（一般には、１％以下）でなくてはならない。音声認識アルゴリズムのトレーニングを拡張するには、この程度の性能は確保されなくてはならない。少なくともいくつかの音声認識アルゴリズムの必要なトレーニングは、オンラインプロセッサ１１０がオンラインメモリの問い合わせ記録領域１５４に記憶された問い合わせ記録を使用することで、オフラインプロセッサ１２０によって自動的に行われる。図２を参照すると、オフラインプロセッサ１２０はオフラインメモリ１６０のオフラインプログラム領域１６２に記憶されたインストラクションを実行し、オンラインメモリ１５０の問い合わせ記録領域１５４に記憶された問い合わせ記録を、認識後アルゴリズムに従って処理する。これによって、トレーニング記録が、オフラインメモリ１６０のトレーニング記録領域１６４に記憶される。認識後アルゴリズムは、オフラインメモリ１６０の名前／番号データベース領域１６６に記憶されたデータにもとづいている。オフラインプロセッサ１２０は、オフラインプログラム領域１６２に記憶されたインストラクションをさらに実行し、トレーニング記録をトレーニングアルゴリズムに従って処理することで変更された音声認識アルゴリズムモデルパラメータを得て、さらに変更された音声認識アルゴリズムにアクセスする。変更されたモデルパラメータの形式で行われる音声認識アルゴリズムに対する変更は、オフラインメモリ１６０のオフラインモデルパラメータ領域１６８に記憶される。ここで、変更された音声認識アルゴリズムがオンラインプロセッサ１１０が現在適用している音声認識アルゴリズムよりもかなり優れたものであるならば、オンラインプロセッサ１１０が使用されていないときに、オフラインプロセッサ１２０はオフラインプログラム領域１６２に記憶されているインストラクションをさらに実行し、オフラインメモリ１６０のオフラインモデルパラメータ領域１６８から、変更されたモデルパラメータを、オンラインメモリ１５０のオンラインモデルパラメータ領域１５８へダウンロードする。オンラインプロセッサ１１０は、変更された音声認識アルゴリズムを使用して、より優れた音声認識能力を発揮する。電話番号案内自動システム１００の一つの実施例では、地域名を認識する音声認識アルゴリズムを、異音隠れマルコフモデル（ＨＭＭ）のライブラリに基づいて構成する。各異音に対して２つの異なる型のＨＭＭが関連づけされる。ＨＭＭの一つの型は、ケプストラム特徴ベクトルを使用して得られ、ＨＭＭの他の型は等化ケプストラムベクトルを使用して得られる。地域名のボキャブラリには、予想される接頭語、接尾語に連鎖される全ての予測されうる地域名の異音表記が含まれる。結果として、地域名ボキャブラリの各地域名は、各々の型のいくつかのＨＭＭに関連づけ、これらＨＭＭの各々が、その地域名の異音表記の異音に対して異音ＨＭＭの連鎖を含む。音声認識アルゴリズムはまた、アプリオリの要素を有し、それは、特定のＮＰＡ−ＮＸＸ部分を各自の電話番号に有する利用者が地域名ボキャブラリの特定地域に対する電話番号一覧を要求するであろう確率を特徴とするものである。各自の電話番号のＮＰＡ−ＮＸＸ部分は、利用者の地理的位置を示すものである。直感的に言うと、利用者が所定の地域を求める確率は、その地域の人口と利用者とその地域の間の距離によって決められる。初歩ののアプリオリ・モデルはこのような直感的な利用者行動パターンの推定に基づくものである。図４Ａおよび図４Ｂは、音声認識アルゴリズムの主要なステップを示すフローチャートである。オンラインプロセッサ１１０は、自動的に受信された音声信号を処理し、音声信号を、ケプストラム特徴ベクトルのシーケンスおよび等化ケプストラム特徴ベクトルのシーケンスの形で表示する。これら特徴ベクトルのシーケンスを得るのに必要な信号処理ステップは、米国特許第５，０９７，５０９に記載されるものと同様のものである。（１９９２年５月１７日に発行された、Ma tthew Lennigの米国特許第５，０９７，５０９、"REJECTION METHOD FOR SPEECH RECOGNITION"。）図４Ａおよび図４Ｂのフローチャートでは、地域名はより一般的な呼称「オーソグラフィー（正しい綴り）」で示される。米国特許出願第０８／０８０，５４３に記載されているのと同様の２経路検索アルゴリズムは、地域名ボキャブラリの各地域名表記に対応する鎖状ＨＭＭによって、特徴ベクトルのシーケンスが生成される確率の測度を計算する際に使用される。（１９９３年６月２４日に、Vishawa Gupta et alの名で出願された米国特許出願第０８／０８０，５４３の"SPEECH RECOGNITION METHOD USING TWO PAS S SEARCH"。）特に、２経路検索アルゴリズムの第１の経路において、ＨＭＭに基づく簡略化されたケプストラムベクトルが、短縮検索アルゴリズムに使用され、ケプストラム特徴ベクトルのシーケンスが、地域名ボキャブラリの全ての表記に対して、各地域名表記に対応する鎖状ＨＭＭによって生成されるログ確率が推定される。各地域名表記に対する推定されたログ確率は、各自ＮＰＡ−ＮＸＸを有する利用者が対応地域名を要求する確率のアプリオリ測度によって重みづけされ、アプリオリ・モデルに従って計算される。各地域名に対応する表記の重みづけされたログ確率は比較され、各地域名に対してもっとも重みづけの高いログ確率を決定し、値の大きい順に記憶される。重みづけされたログ確率の高さが上位３０に入る地域名は、上位３０の認識候補となる。重みづけされた確率の高さが上位３０に入る地域名に対応する索引リストが、問い合わせ記録に記録される。２経路検索アルゴリズムの第２ステップでは、より細かなケプストラムにもとづくＨＭＭは、全ての地域名表記に対し、３０の認識および限定ビタビ検索アルゴリズムの候補に対応し、３０の認識候補を有する各地域名表記に対応する鎖状ＨＭＭによってケプストラム特徴ベクトルが生成されるログ確率をより正確に再計算するために使用される。さらに、各地域名に対応する表記について重みづけされたログ確率が比較され、各地域名に対してもっとも高いログ確率を決定し、確率の高い順にソートされる。重みづけされたログ確率の高さが上位３位に入る地域名は、上位３位の認識候補となり、これらの重みづけ後ログ確率に対応する地域名表記が、上位３位の地域名表記と認識される。さらに、上位３位の地域名表記および限定ビタビ検索に対する細密な等化ケプストラムＨＭＭを用いて、等化ケプストラム特徴ベクトルが上位３位の地域名表記に対応する鎖状ＨＭＭによって生成されるログ確率を計算する。ケプストラムＨＭＭおよび特徴ベクトルを用いて計算されたログ確率は、等化ケプストラムＨＭＭおよび特徴ベクトルを用いて計算されたログ確率と合わさり、認識の上位各３候補の合計ログ確率が計算される。合計ログ確率は、音声信号表示中のフレーム数によって正規化され、上位各３候補の「フレーム毎の合計ログ確率」が計算される。（各特徴ベクトルは、音声信号表示の一つのフレームに対応する。）フレーム毎の合計ログ確率がもっとも高い地域名は、その地域名の第１候補と認定され、２番目にフレーム毎の合計ログ確率がもっとも高い地域名は、その地域名の第２候補と認定される。もっとも高い合計ログ確率に対応する地域名の第１候補の表記は、第１候補と認識される。受理基準は、地域名の第１候補の認識が正しいものであるかどうかを決定するために適用される。図５Ａ、図５Ｂは、この受理基準適用を示すフローチャートである。図５Ａ、図５Ｂにおいて、地域名はより一般的に「オーソグラフィ（正しい綴り）」という呼称で示されている。利用者が電話番号案内自動システム１００によって地域名を述べるように誘導されても、音声による地域名の応答が必ずしもあるとはかぎらない。例えば、利用者は地域名を述べるようにとの誘導に対して、「知りません」と応答することもあり得る。訂正手段がない限り、音声認識アルゴリズムは、このような音声応答を地域名ボキャブラリの内の地域名として認識しようと試みる。しかしこの様な場合は、音声認識アルゴリズムによって認識されるいかなる地域名も誤りとなる。音声認識アルゴリズムの性能は、地域名ボキャブラリの地域名に対応しないものとして予測されうる応答に対する表記を含ませることによって、また、このような表記に対して「偽（デコイ）」というラベルを付すことによって向上する。音声認識アルゴリズムが偽を第１の地域名候補として選択すると、アルゴリズムは、地域名認識はなされないと結論する。音声認識アルゴリズムによって正確に認識されるよりも誤って認識されやすいと決定された地域名表記のいくつかは、それが正式な地域名に対応するものであっても、この様な表記に偽のラベルを付すことで、音声認識アルゴリズムの性能を向上させることが可能である。地域名表記の第１候補が地域名ボキャブラリにおいて偽であるとマークされなければ、５つの受理基準パラメータが計算される。１つの受理基準パラメータ（Ａ）は、地域名の第１候補のフレーム毎のログ確率と地域名の第２候補のフレーム毎のログ確率との差を示す。残る４つの受理基準パラメータを計算するには、ビタビによるアラインメント技術を用いて、特徴ベクトルを表記の第１の候補に対応する鎖状ＨＭＭの異音ＨＭＭに対応させる。表記の接頭語、接尾語に対応する異音ＨＭＭに対応した特徴ベクトルは度外視され、残った特徴ベクトルを用いて、表記の「核部分」（すなわち、地域名のみに対応している部分の表記）のフレーム毎のログ確率を計算する。これによって、さらに２つの受理基準パラメータと、表記の核部分のフレーム毎のログ確率がケプストラム特徴ベクトルとＨＭＭ（Ｂ）を用いて、表記の核部分のフレーム毎のログ確率が等化ケプストラム特徴ベクトルとＨＭＭ（Ｃ）を用いて計算され、生成される。受理基準パラメータＢおよびＣの計算に用いられるビタビによるアラインメント・ステップは、特徴ベクトルを個々の異音ＨＭＭに対応させる。これら異音ＨＭＭは鎖状になっており、各地域名表記に対するＨＭＭが作成される。このようなアラインメントによって、各異音に対応するフレーム数の計算が可能となる。通常の音声では、話された異音は持続時間の分布を有し、それはガウス分布をモデルとするものであり、その平均および偏差は多くの話された異音のサンプルを分析することで得られる。各特徴ベクトルは、一般に知られた持続時間（典型的には２５．６ｍｓ）を有する音声信号の時間刻みに対応するので、各異音の持続時間は、異音ＨＭＭに対応された特徴ベクトルから推定することができる。このように推定された異音の持続時間は、異音持続時間の予測される分布と比較され、ビタビによるアラインメントが有効である確率を予測する。表記の第１候補に対する「持続時間の確率測度」は、核における各異音に対する持続時間のログ確率を算出し、さらに核における全ての異音に対するこれらログ確率を平均することによって計算される。この計算は、ビタビによるアラインメントを用いて、ケプストラム特徴ベクトルを表記の第１候補の核部分のケプストラムＨＭＭに対応させ、一つの持続時間確率測度（Ｄ）を得、さらにビタビによるアラインメントを用いて、等化ケプストラム特徴ベクトルを表記の第１候補の核部分の等化ケプストラムＨＭＭに対応し、他の一つの持続時間確率測度（Ｅ）を得るために行われる。各受理基準パラメータ（Ａ，Ｂ，Ｃ，Ｄ，Ｅ）に対応する確率モデルは、正しい認識確率を個々の受理基準パラメータの関数ととらえる。受理基準パラメータ値はこのモデルに適用されると、正しい受理の確率の５つの測度（Ｐａ（Ａ），Ｐｂ（Ｂ），Ｐｃ（ｃ），Ｐｄ（ｄ），Ｐｅ（Ｅ））が得られ、正しい認識確率の複合測度（Ｐ）は、これら５つの推定値の重みづけされた積として計算される。Ｐ＝[Pa(A)]⁸ [Pb(B)] [Pc(C)] [Pd(D)]² [Pe(E)]² 複合測度（Ｐ）は、経験的に決定された閾値と比較される。この複合測度（Ｐ）が閾値を越えれば、受理基準が満たされ、音声信号が地域名の第１候補と認識されたということが宣言される。この複合測度（Ｐ）が閾値を越えなければ、受理基準は満たされず、音声信号は認識されないと宣言される。上記の音声認識アルゴリズムの自動トレーニングは、５つの要素を含む。１．トレーニング記録の生成２．異音ＨＭＭのトレーニング３．アプリオリ・モデルのトレーニング４．受理基準確率モデルのトレーニング５．受理基準閾値のトレーニング図６Ａ、図６Ｂは、問い合わせ記録からトレーニング記録を生成するオフラインプロセッサ１２０の動作を示すフローチャートである。図６Ａでは、地域名は一般的に「オーソグラフィ（正しい綴り）」と置き替えて用いられる。オフラインプロセッサ１２０は、問い合わせ記録ブロック１６０にアクセスし、その問い合わせ記録に対する検索された電話番号のＮＰＡ−ＮＸＸ部分と地域名を検索する。オフラインプロセッサ１２０は、オフラインメモリ１６０の名前／番号データベース領域１６６にアクセスし、そのＮＰＡ−ＮＸＸに対応する地域名のリスト記載事項を検索する。ここで、検索された地域名が作成されたリスト記載事項上になかった場合は、その検索されたリスト記載事項に加えられる。オフラインプロセッサ１２０は、問い合わせ記録メモリブロック１６０にアクセスし、２経路音声認識アルゴリズム中の第１経路で推定された、重みづけされたログ確率がもっとも高い３０の地域名のリスト記載事項を検索する。名前／番号データベース１６６から作成された地域名のリスト記載事項は、重みづけされたログ確率がもっとも高い３０の地域名のリスト記載事項と比較される。ここで、いかなる地域名も名前／番号データベース１６６から作成されたリスト記載事項上にはあるが、３０の地域名表記のリスト記載事項上になければ、作成されたリスト記載事項は、これらのリストされていない地域名を加えるように変更される。すなわち、名前／番号データベース１６６から作成されたリスト記載事項上になく、重みづけされたログ確率がもっとも低い地域名を入れ替える。これにより、変更後もリスト記載事項は３０の地域名を含むことになる。オフラインプロセッサ１２０は、２経路検索音声認識アルゴリズムの第２経路を適用し、変更されたリスト記載事項上の３０の地域名に対応するすべての表記に対して鎖状ケプストラムＨＭＭを使用し、各鎖状ＨＭＭによって問い合わせ記録のケプストラム特徴ベクトルが生成されるログ確率を導く。オフラインプロセッサ１２０は、変更されたリスト記載事項上のどの地域名表記がもっとも高いログ確率を有するか、すなわち、「もっともよく認証される表記」であるかを決定する。ここで、リスト記載事項上にない地域名に対応する地域名表記で比較的高いログ確率を有するものが５つまたはそれ以上であると、音声信号表示、検索された電話番号のＮＰＡ−ＮＸＸ部分、問い合わせ時刻、音声信号が「ボキャブラリにない」ことを示すラベルを含むトレーニング記録が、オフラインメモリ１６０のトレーニング記録領域１６４に生成される。上記以外の場合、オフラインプロセッサ１２０は、どの２つの地域名表記が第１の認証表記の次に高いケプストラム・ログ確率を有するかを決定する。等化ケプストラム・ログ確率は、これら２つの地域名表記に対して計算され、表記の第１候補に対しては、限定ビタビ検索と等化ケプストラム特徴ベクトルとＨＭＭを用いて計算される。もっともよく認証される表記がもつとも高い等化ケプストラム・ログ確率を有していなければ、音声信号表示、検索された電話番号のＮＰＡ −ＮＸＸ部分、問い合わせ時刻、音声信号が「ボキャブラリにない」ことを示すラベルを含むトレーニング記録が、オフラインメモリ１６０のトレーニング記録領域１６４に生成される。上記以外の場合、オフラインプロセッサ１２０は、ケプストラム・ログ確率と等化ケプストラム・ログ確率を組み合わせ、複合ログ確率（Ｌ１）を表記の第１候補に対して計算し、複合ログ確率（Ｌ２）を表記の第２候補に対して計算する。これら２つの複合ログ確率間の正規化された差は、閾値と比較される。ここで、正規化された差が閾値を越えていなければ、オフラインプロセッサ１２０は、音声信号表示、検索された電話番号のＮＰＡ−ＮＸＸ部分、問い合わせ時刻を含むトレーニング記録を生成し、音声信号が「ボキャブラリにない」ことを示すラベルをオフラインメモリ１６０のトレーニング記録領域１６４に生成する。上記以外の場合（すなわち、複合ログ確率間の正規化された差が閾値を越える場合）、オフラインプロセッサ１２０は、音声信号表示、検索された電話番号のＮＰＡ−ＮＸＸ部分、問い合わせ時刻を含むトレーニング記録を生成し、音声信号が「もっともよく認証される表記」に対応することを示すラベルをオフラインメモリ１６０のトレーニング記録領域１６４に生成する。（このラベルは、地域名表記を独自に認識し、その表記には、そこに含まれているいかなる接頭語、接尾語も含まれている。）図６Ａ、図６Ｂに示されたプロセスは、各問い合わせ記録毎に繰り返される。問い合わせ記録は、トレーニング記録が生成されると、オンラインメモリ１５０の問い合わせ記録領域１５４の新たな問い合わせ記録を記録するために除去される。多くのトレーニング記録が生成されると、オフラインプロセッサ１２０は、トレーニングアルゴリズムを実行し、それらトレーニング記録を用いて音声認識アルゴリズムのトレーニングを行う。図７は、トレーニング記録を用いて異音ＨＭＭの自動トレーニングを行うことを示すフローチャートである。異音ＨＭＭは、初期段階では、音声専門家が従来の方法を用いて収集し、ラベルを付した音声サンプルの大ライブラリを用いてトレーニングされる。さらにトレーニング記録を用いて異音ＨＭＭの自動トレーニングを行う場合、一般に知られるビタビ・アルゴリズムが、各使用可能なトレーニング記録に対して一回繰り返される。特に、トレーニング記録において特定の地域名表記のラベルを付される特徴ベクトルの各シーケンスに対して、既知のビタビ・アルゴリズムは、その地域名表記に対する鎖状ＨＭＭの最大確率経路を計算するのに使用される。最大確率経路を表わす統計は、計上され、初期ＨＭＭトレーニングと以前にさらに行われたＨＭＭトレーニングの間に累積された統計の対応箇所に加えられる。異音ＨＭＭのパラメータは、累積モデルパラメータ統計にもとづき再計算される。（１９８６年１月のRabiner et alによるＩＥＥＥＡＳＳＰマガジンのビタビ・アルゴリズムに関する記述、第４〜１６頁。）音声認識アルゴリズムは、ケプストラム異音ＨＭＭと等化ケプストラム異音ＨＭＭの双方を用いるため、各トレーニング記録はケプストラム特徴ベクトルのシーケンス、等化ケプストラム特徴ベクトルのシーケンスを含む。ケプストラム特徴ベクトルは、上記のようにケプストラム異音ＨＭＭのトレーニングに使用され、等化ケプストラム特徴ベクトルは上記のように等化ケプストラム異音ＨＭＭのトレーニングに使用される。結果的に異音ＨＭＭは、米国特許出願第０７／７７２，９０３に記載されるように、音声認識の性能が向上するように変更される。（１９９１年１０月８日に Vishawa Gupta et alによって出願された米国特許出願第０７／７７２，９０３の、"Flexible Vocabulary Recognition"。）変更されたモデルパラメータは、変更されたＨＭＭを定義し、オフラインメモリ１６０のオフラインモデルパラメータ領域１６８に記憶される。図８は、音声認識アルゴリズムに使用されるアプリオリ・モデルの自動トレーニングを示すフローチャートである。トレーニング記録を使用して、各地域名を要求する各ＮＰＡ−ＮＸＸからの問い合わせの実際の数をカウントし、累積統計を使用して、利用者のＮＰＡ−ＮＸＸの下で要求される各地域名のアプリオリ確率を計算する。閾値を用いることで、計算されたアプリオリ・モデルの使用は、統計的に意味を持つモデルを保証するように十分に統計が累積された場合に限られる。変更されたモデルパラメータは変更されたアプリオリ・モデルを定義し、オフラインメモリ１６０のオフラインモデルパラメータ領域１６８に記憶される。図９は、図５Ａと図５Ｂを参照して上に記載された受理基準の適用にあたり使用される確率モデルの自動トレーニングを示すフローチャートである。確率モデルのトレーニングは、電話番号案内自動システム１００の使用にあたり直面する「ボキャブラリにある」サンプルと「ボキャブラリにない」サンプルを実質的に同じ比率で有するサンプルのセットを使用しておこなわれなくてはならない。電話番号案内自動システム１００の実際の動作中に集められた音声信号表示はこの比率を有するが、音声された場合「ボキャブラリにある」ものでも８５％のものしか「ボキャブラリにある」と認識されない。認識されなかった１５％の「ボキャブラリにある」音声は、トレーニング記録に誤って「ボキャブラリにない」というラベルを付される。地域名のラベルが付される音声信号表示と「ボキャブラリにない」というラベルを付される音声信号表示の間の比率を適正に保つには、「ボキャブラリにない」というラベルを付される音声信号表示のうち３０％のみが選択され、地域名ラベルを付された音声信号表示とともに、確率モデルのトレーニングに使用されるトレーニング記録のセットに含まれることになる。（「ボキャブラリにある」ものと「ボキャブラリにない」ものとの相対的な比率は、これらを作成する誘導文句に依存し、所定の適用に対して経験的に決定されなくてはならない。）トレーニング・セットが決定されると、確率モデルのトレーニングは、基本的には米国特許第５，０９７，５０９に記載されるようになる（ただし、受理基準パラメータは異なるが、トレーニング技術は同じ原理に基づくものである。）地域名は、図９において、一般的に「オーソグラフィ（正しい綴り）」と呼ばれる。トレーニング・セットの各トレーニング記録に対して、第１の地域名候補を決定するために、図４Ａと図４Ｂの音声認識アルゴリズムに関連のあるステップが用いられる。音声認識アルゴリズムのステップは、図７のＨＭＭトレーニングプロセスによって変更されたＨＭＭと、図８のアプリオリ・モデルトレーニングプロセスによって変更されたアプリオリ・モデルを使用して適用される。ここで、音声認識アルゴリズムによって決定された第１の地域名候補が偽であると、そのトレーニング記録に対してこれ以上の計算は行われず、トレーニング・セットの次のトレーニング記録が選択される。ここで、第１の地域名候補が偽でないとすると、受理基準パラメータＡ，Ｂ，Ｃ，Ｄ，Ｅが、図７のＨＭＭトレーニングプロセスによって変更されたＨＭＭを使用して、図５Ａと図５Ｂに示す受理アルゴリズムに関連のあるステップに従って計算される。第１の地域名候補がトレーニング記録の地域名索引に対応すると、変更された音声認識アルゴリズムは、地域名を正しく認識したとみなされ、各受理基準パラメータＡ，Ｂ，Ｃ，Ｄ，Ｅの値に対応する正しい受理カウンタがインクリメントされる。第１の地域名候補がトレーニング記録の地域名索引に対応しないと、変更された音声認識アルゴリズムは、地域名を誤って認識したとみなされ、各受理基準パラメータＡ，Ｂ，Ｃ，Ｄ，Ｅの値に対応する誤り受理カウンタがインクリメントされる。トレーニング・セットの全てのトレーニング記録の処理が済むと、正誤それぞれの受理カウンタを使用して、確率モデルＰａ（Ａ）、Ｐｂ（Ｂ）、Ｐｃ（Ｃ）、Ｐｄ（Ｄ）、Ｐｅ（Ｅ）を算出する。これらは、各受理基準パラメータＡ，Ｂ，Ｃ，Ｄ，Ｅの関数として正しい受理の確率を推定する。確率モデルの導入は、米国特許第５，０９７０，５０９に開示されるのと同様な技術に基づくものである。これら技術は、Ａ，Ｂ，Ｃ，Ｄ，Ｅを独立した変数として扱う。変更された確率モデルＰａ（Ａ）、Ｐｂ（Ｂ）、Ｐｃ（Ｃ）、Ｐｄ（Ｄ）、Ｐｅ（Ｅ）を定義するモデルパラメータは、オフラインメモリ１６０のオフラインモデルパラメータ領域１６８に記憶される。図１０Ａ、図１０Ｂは、受理基準閾値のトレーニングと音声認識アルゴリズムの評価を示すフローチャートであり、音声認識アルゴリズムは異音ＨＭＭ、アプリオリ・モデル、受理基準確率モデル、受理基準閾値のトレーニングによって変更される。図１０Ａ、図１０Ｂでは、地域名は一般的に「オーソグラフィ（正しい綴り）」と呼ばれる。テスト結果を有効なものとするためには、変更された音声認識アルゴリズムのテストを行わなくてはならない。ここで、「ボキャブラリにある」サンプルと「ボキャブラリにない」サンプルの比率が、変更された音声認識アルゴリズムが実際のトラフィックに適用されたときに、起こる比率と実質的に同様であるような比率を有するトレーニング記録についてテストが行われる。結果的に、音声認識アルゴリズムの受理基準の適用にあたって使用された確率モデルのトレーニングを参照して上述したように、「ボキャブラリにない」というラベルを付されたトレーニング記録のいくつかは、適切なテスト・セットを組み合わせるために除去しなくてはならない。テスト・セットはまた、有効なテスト結果を得るために、ＨＭＭの列に使用されなかったトレーニング記録から組み合わされなくてなならない。正しい受理（ＣＡ）、誤り受理（ＦＡ）、正しい拒否（ＣＲ）、誤り拒否（ＦＲ）のそれぞれのカウンタは、０．００，０．０５，０．１０，．．．１，００の値を有する２１の各候補閾値に対して設けられ、０に初期化されている。図４Ａ、図４Ｂの音声認識アルゴリズムに関連するステップは、図７のトレーニングプロセスによって変更されたＨＭＭと図８のトレーニングプロセスによって変更されたアプリオリ・モデルを使用して、トレーニング・セットの各トレーニング記録に適用され、そのトレーニング記録に対する第１の地域名候補を決定する。図５Ａ、図５Ｂの受理基準アルゴリズムに関連するステップは、図９に従って導かれた受理基準モデルを使用して適用され、第１の地域名候補の受理が正しい確率を推定する。第１の地域名候補が偽でないとすると、トレーニング記録に記録された地域名と比較される。ここで、トレーニング記録に記録された地域名と一致すると、受理基準閾値が正しい受理の予測確率よりも小さければ、変更された音声認識アルゴリズムは地域名の認識を行うことが正しいので、結果として、正しい受理（ＣＡ）カウンタが、正しい受理の予測確率よりも小さいすべての閾値に対して、インクリメントされる。もし受理基準閾値が正しい受理の予測確率よりも大きければ、変更された音声認識アルゴリズムは地域名の認識を行わないことが誤りなので、誤り拒否（ＦＲ）カウンタが、正しい受理の予測確率よりも大きいすべての閾値に対して、インクリメントされる。ここで、第１の地域名候補がトレーニング記録中の地域名と同じでなければ、受理基準閾値が正しい受理の予測確率よりも小さい場合は、変更された音声認識アルゴリズムは地域名の認識を行うことが誤りであるので、結果として、誤り受理（ＦＡ）カウンタが、正しい受理の予測確率よりも小さいすべての閾値に対して、インクリメントされる。もし受理基準閾値が正しい受理の予測確率よりも大きければ、変更された音声認識アルゴリズムは地域名の認識を行わないことが正しいので、正しい拒否（ＣＲ）カウンタが、正しい受理の予測確率よりも大きいすべての閾値に対して、インクリメントされる。ここで第１の地域名候補が偽であり、トレーニング記録に記録された地域名が「ボキャブラリにない」に対応するならば、変更された音声認識アルゴリズムは、話された応答がどの閾値が選択されても地域名ボキャブラリの地域名でないと正しい決定を下すので、正しい拒否（ＣＲ）カウンタが、全ての閾値に対してインクリメントされる。ここで第１の地域名候補が偽であり、トレーニング記録に記録された地域名が「ボキャブラリにない」に対応しないならば、変更された音声認識アルゴリズムは、話された応答がどの閾値が選択されても地域名ボキャブラリの地域名でないと誤って決定を下すので、誤り拒否（ＦＲ）カウンタが、全ての閾値に対してインクリメントされる。トレーニング・セットの全てのトレーニング記録が上記のように処理されると、これらカウンタを使用して、各閾値に対する誤り受理の確率を算出する。上記のように、音声認識アルゴリズムが電話番号案内に適用された場合に有効であるのは、誤り受理（ＦＡ）の確率が非常に低く保たれている場合である。なぜならば、地域名の誤り受理によって、電話番号案内オペレータの仕事量が増えてしまうからである。電話番号案内自動システム１００が電話番号案内の作動コスト削減に貢献することを保証するには、音声認識アルゴリズムの性能を、誤り受理の最大許容率の観点により特定する。閾値は、誤り受理最大許容率にもっとも近い算出された誤り受理確率に対応するものが選択される。さらに、カウンタを使用して、選択された閾値に対する正しい受理の確率を計算する。正しい受理の確率が、今以前の音声認識アルゴリズムのトレーニング中に達成されたものよりも高いならば、変更された音声認識アルゴリズムの性能は、以前の性能よりも向上したことになる。結果として、変更されたＨＭＭ、アプリオリ・モデル、受理基準確率モデルおよび受理基準閾値が、オフラインプロセッサ１２０によって、オフラインメモリ１６０のオフラインモデルパラメータ領域１６８からオンラインメモリ１５０のオンラインモデルパラメータ領域１５６へ、オンラインプロセッサ１１０が動作していないときにダウンロードされる。正しい受理の確率が、今以前の音声認識アルゴリズムのトレーニング中に達成されたものよりも低いならば、オンラインプロセッサ１１０で使用するために、変更されたモデルと閾値をダウンロードしない。図１１は、変更された音声認識アルゴリズムの性能をさらに向上させるための処理ステップを示すフローチャートである。変更された音声認識アルゴリズムは、各トレーニング記録に記憶された音声信号表示に適用される。音声信号が、変更された音声認識アルゴリズムによって認識されたと宣言され、トレーニング記録に記憶された地域名索引に認識された地域名表示が対応すると、正しい受理（ＣＡ）カウンタは、認識された地域名表示に対して、インクリメントされる。トレーニング記録に記憶された地域名索引に認識された地域名表示が対応しないと、誤り受理（ＦＡ）カウンタは、認識された地域名表示に対して、インクリメントされる。音声信号が変更された音声認識アルゴリズムによって認識されないと宣言されると、どのカウンタもインクリメントされない。すべてのトレーニング記録が変更された音声認識アルゴリズムによって処理されると、ＣＡおよびＦＡカウンタの比率が、地域名ボキャブラリの各地域名表示に対して計算され、所定の閾値と比較される。地域名表示に対する比率が閾値を越えていないならば、その地域名表示は偽というラベルを付され、変更された音声認識アルゴリズムは、他の場合においてその地域名表示として認識するいかなる音声信号表示も認識されないと宣言する。例えば、所定の閾値が一定にされれば、ＣＡカウンタがＦＡカウンタよりも小さい地域名表示は、いかなるものでも偽のラベルを付される。これによって、変更された音声認識アルゴリズムの性能が向上する。なぜならば、この変更された音声認識アルゴリズムをトレーニング・サンプルに適用することで、その特定地域名の認識が正しいよりも、誤りであるようになるからである。他の適用については、異なる閾値の使用が適切であると思われる。上記の実施例は、本発明の原理から逸脱しない範囲で変更することも可能である。例えば、自動音声認識に地域名の他に名前を認識させることも可能である。特に、電話番号案内自動システム１００は、電話番号案内の利用者に対して、利用者が電話をかけたい人あるいは組織の名称（例えば、事業部署や、政府機関）を述べるように誘導するようにプログラムすることができる。（これら名称は、本出願においては「問い合わせエントリ名」と呼ぶ。）電話番号案内自動システム１００は、問い合わせ頻度の高いリスト記載事項に対応する問い合わせエントリ名を認識するようにプログラムされる。問い合わせ頻度の高いリスト記載事項に対応する問い合わせエントリ名を認識されると、電話番号案内自動システム１００は、自動的に問い合わせエントリ名が電話番号上にマップされている電話番号案内データベース６００を参照し、問い合わせた電話番号が、利用者に対してオペレータを介すことなくＡＲＵ７００を介して検索されるようにプログラムされる。利用者に電話番号を知らせるにあたり、システムは、認識した問い合わせエントリ名を利用者に音声で知らせ、その認識した問い合わせエントリ名が正しくないときに、特定の方法で（例えば、「正しくない」というように）利用者に知らせる。認識された問い合わせエントリ名の確認または否認の誘導は、特定の認識された問い合わせエントリ名によって選択的に行われ、音声認識アルゴリズムが既に高い確率で認識していると知らされている問い合わせエントリ名については、この確認あるいは否認作業が省かれ、電話番号案内の利用者が必要のない不便を感じたり、データのトレーニングが不必要に処理されたりしないようにする。電話番号案内自動システム１００は、問い合わせたエントリ名が正しくないという信号を受信すると、オペレータ台コントローラ４００を介して利用者をオペレータ台５００に接続し、電話番号案内の問い合わせを完了する。あるいは、電話番号案内自動システム１００は、問い合わせエントリ名の次の候補を挙げて、所定数の否認が確認された後に、利用者をオペレータ台５００へ接続する。同様に、問い合わせエントリ名が認識されないとき、電話番号案内自動システム１００は、自動的にオペレータ台コントローラ４００を介して利用者をオペレータ台５００に接続し、電話番号案内呼を完了する。電話番号案内自動システム１００は、問い合わせ記録を生成し、そこには、問い合わせエントリ名の誘導に対して利用者から受信された音声信号の表示と利用者に（電話番号案内自動システム１００によって自動的に、あるいは、オペレータによって手動で）知らされた電話番号が含まれる。電話番号案内自動システム１００はさらに、問い合わせ記録を処理し、名前／番号データベースにアクセスするようにプログラムされる。名前／番号データベースは、問い合わせエントリ名ボキャブラリの問い合わせエントリ名とそれに対応する電話番号を関連づけ、認識された問い合わせエントリ名が検索された電話番号に対応するかどうかを決定し、問い合わせエントリ名が検索された電話番号に対応するときに、音声信号表示に確認された問い合わせエントリ名のラベルを付すトレーニング記録を生成する。トレーニング記録は、異音ＨＭＭと上記の拒否テーブルのトレーニングに使用される。問い合わせエントリ名に対する音声認識アルゴリズムは、アプリオリな要素を含み、それは、利用者の電話番号のＮＰＡ−ＮＸＸと問い合わせが行われた時間に従って要求される確率の各問い合わせエントリ名の重みづけをする。直感的に言えば、ある問い合わせエントリ名は営業日の営業時間中に問い合わせられることが多く（例えば、銀行）、他の問い合わせエントリ名は営業時間外あるいは週末に問い合わせが多くなる（例えば、時間外緊急ライン）。このような問い合わせパターンを使用して、アプリオリ・モデルを生成し、問い合わせエントリ名が電話番号案内呼があった時間に要求される確率が推定される。電話番号案内自動システム１００は、問い合わせ記録中に問い合わせ回数を記録するようにプログラムされ、問い合わせ回数をトレーニング記録に移転し、認識が正しいとされた問い合わせの回数を使用して自動的にアプリオリ・モデルの性能を向上させるようにトレーニングを行う。上記のように、問い合わせ回数に基づくアプリオリ・モデルは、利用者のＮＰＡ−ＮＸＸに基づくアプリオリ・モデルと組み合わせることが可能である。上記のように、電話番号案内自動システム１００は、一つのオンラインプロセッサ１１０と一つのオフラインプロセッサ１２０を含む。電話番号案内自動システム１００を拡張し、いくつかの電話番号案内問い合わせに対して同時にサービスを提供するには、オンラインプロセッサ１１０をいくつか設置し、さらに各々に対して対応インタフェース１３０、１４０と対応メモリ１５０、１６０を備える。オフラインプロセッサ１２０は、音声認識アルゴリズムのトレーニングに続いて、いくつかのオンラインプロセッサによって集められた問い合わせ記録を処理する。また、多重オフラインプロセッサ１２０を設置してもよく、各オフラインプロセッサ１２０は、上に列挙されたトレーニング機能のいずれかに特定化される。オフラインプロセッサ１２０は、各自の問い合わせ記録メモリを有して設置され、そのメモリに対して、各オンラインプロセッサ１１０に関連するオンラインメモリ１５０の問い合わせ記録メモリ領域１５４から問い合わせ記録がダウンロードされる。上記のように、音声信号と２経路検索アルゴリズムの第１の経路の結果から導かれた特徴ベクトルは、オンラインプロセッサ１１０によって生成された問い合わせ記録に記録され、オフラインプロセッサが後にそれを利用する。あるいは、オンラインプロセッサ１１０によって生成された問い合わせ記録は、ディジタル符号化された音声信号を含み、オフラインプロセッサ１２０が、音声信号の信号処理を繰り返して特徴ベクトルを導き、２経路音声認識アルゴリズムの第１の経路を繰り返してこれらパラメータを再び導き出すようにする。これらの実施例および他の実施例は、以下の請求項で定義される発明の請求の範囲に含まれる。

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁶ 識別記号庁内整理番号ＦＩＨ０４Ｍ 3/42 9567−5ＧＨ０４Ｍ 3/60 Ｚ 3/60 9567−5ＧＨ０４Ｑ 3/545 Ｈ０４Ｑ 3/545 9289−5ＬＧ０６Ｆ 15/40 ３７０Ｅ (72)発明者グプタ・ヴィシュワ・エヌカナダ国，ジェイ４ワイ１ティ２，ケベック，ブロサール，ムスィエールストリート 7145 (72)発明者ホッグソン・ローレン・スィーカナダ国，エイチ９エヌ１エム９，ケベック，ビーコンズフィールド，リンカンドライブ147 (72)発明者レニグ・マシューカナダ国，エイチ３ゼット１ジェイ１, ケベック，ウェストマウント，ウィンチェスターアベニュー２ (72)発明者シャープ・アール・ダグラスカナダ国，エイチ３ゼット１エイチ９, ケベック，ウェストマウント，ウィンチェスターアベニュー 17 (72)発明者ワスメイヤー・ハンス・エーカナダ国，ケイ２スィー３スィー２，オンタリオ，オタワ，サウスウッドドライブ1203

Claims

【特許請求の範囲】１．電話番号案内機能を少なくとも部分的に自動化する方法において：電話番号リスト記載事項に関連する名前を利用者が述べるように誘導し；この誘導に応答して利用者から受信された音声信号に基づき、利用者が要求する電話番号を決定し；所望の電話番号を利用者に知らせ；さらに、検索された電話番号に応答するパラメータ変更アルゴリズムに従って、音声認識アルゴリズムのパラメータを変更することを特徴とする自動電話番号案内方法。２．請求項１の方法は、さらに誘導に応答して利用者から受信された音声信号の表示を記憶し、そこで音声認識アルゴリズムのパラメータを変更するステップは：記憶された音声信号の各表示を、検索された電話番号と関連づけ；検索された各電話番号から、少なくとも一つの対応名を作成し；選択され作成された名前を、選択され記憶された音声信号の表示に関連づけ；さらに、選択された音声信号の表示と関連する名前に応答するトレーニングアルゴリズムに従って、音声認識アルゴリズムのパラメータを変更することを特徴とする自動電話番号案内方法。３．請求項２の方法において：利用者を誘導するステップは、所望のリスト記載事項に対応する地域の名前を述べるように利用者を誘導し；名前の作成するステップは、検索された各電話番号から少なくとも一つの地域名を作成し；記憶された音声信号の表示と作成された名前を関連づけるステップは、地域名が選択され記憶された音声信号の表示と関連づけ；さらに音声認識アルゴリズムのパラメータを変更するステップは、選択された音声信号の表示と関連する地域名とに応答するトレーニングアルゴリズムに従って音声認識アルゴリズムのパラメータを変更することを特徴とする自動電話番号案内方法。４．請求項３の方法において：検索された各電話番号から少なくとも一つの対応する地域名を作成するステップは、検索された各電話番号のＮＰＡ−ＮＸＸ部分から少なくとも一つの対応する地域名を作成することを特徴とする自動電話番号案内方法。５．請求項２の方法において：利用者を誘導するステップは、要求されるリスト記載事項に対応する問い合わせエンティティ名を述べるように利用者を誘導し；名前を自動的に作成するステップは、検索された各電話番号から少なくとも一つの問い合わせエントリ名を作成し；記憶された音声信号の表示と作成された名前を関連づけるステップは、問い合わせ地域名を選択され記憶された音声信号の表示と関連づけ；さらに音声認識アルゴリズムのパラメータを変更するステップは、選択された音声信号の表示と関連する問い合わせエントリ名に応答するトレーニングアルゴリズムに従って音声認識アルゴリズムのパラメータを変更することを特徴とする自動電話番号案内方法。６．請求項２の方法において：利用者への所望の電話番号を決定するステップは、音声認識アルゴリズムに従って、利用者から受信された音声信号が名前ボキャブラリの複数の名前の各々に対応した誘導に従って確率の測度を計算することを特徴とする自動電話番号案内方法。７．請求項６の方法において：利用者が所望する電話番号を決定するステップは、さらに、計算された確率測度がもっとも高い名前を、名前の第１候補として選択することを特徴とする自動電話番号案内方法。８．請求項７の方法において：利用者が所望する電話番号を決定するステップは、さらに、名前の第１候補として選択された名前を、計算された確率測度が所定の受理基準を満たす場合に限り、記憶された音声信号の表示に対応するものとして認識することを特徴とする自動電話番号案内方法。９．請求項８の方法において、利用者が所望する電話番号を決定するステップは、さらに、認識された名前を所望の電話番号のデータベース検索におけるパラメータとして使用されることを特徴とする自動電話番号案内方法。１０．請求項６の方法において：選択され作成された名前を選択され記憶された音声信号の表示に関連させるステップは、音声認識アルゴリズムに従って、記憶された音声信号の表示が名前ボキャブラリの選択されたサブセット中の複数の名前の各々に対応する確率測度を計算し、記憶された音声信号の各表示に対する選択されたサブセットは、その記憶された音声信号の表示に関連する検索された電話番号から作成された名前を含むことを特徴とする自動電話番号案内方法。１１．請求項１０の方法において：記憶された音声信号の各表示に対する選択された名前ボキャブラリのサブセットは、利用者が所望する電話番号を決定するステップの間にその記憶された音声信号の表示に対して計算された確率の測度が高い名前を含むことを特徴とする自動電話番号案内方法。１２．請求項１１の方法において：さらに、検索された名前を記憶された音声信号の各表示に関連づけ、そこで、その記憶された音声信号の表示に対する名前ボキャブラリの選択されたサブセットは、その記憶された音声信号の表示に関連する検索された名前を含むことを特徴とする自動電話番号案内方法。１３．請求項１０の方法において：選択され作成された名前を選択され記憶された音声信号の表示に関連づけるステップは、計算された確率測度がもっとも高い名前を、名前の第１候補として選択し、計算された確率測度が所定の受理基準を満たすときに限り、選択された名前を記憶された音声信号の表示と関連づけることを特徴とする自動電話番号案内方法。１４．請求項２の方法において：音声認識アルゴリズムのパラメータをトレーニングアルゴリズムに従って変更するステップは、名前ボキャブラリの名前に関連する隠れマルコフモデルのモデルパラメータを、上記の選択された音声信号の表示と関連する名前に応答するビタビトレーニングアルゴリズムに従って計算することを特徴とする自動電話番号案内方法。１５．請求項１４の方法において：音声認識アルゴリズムのパラメータをトレーニングアルゴリズムに従って変更するステップは、さらに、確率モデルに対するモデルパラメータを計算し、確率モデルは、音声認識アルゴリズムによる名前ボキャブラリの名前の認識が正しく行われる確率を、記憶された音声信号の表示と隠れマルコフモデルにより作成された受理基準パラメータの関数として推定することを特徴とする自動電話番号案内方法。１６．請求項１５の方法において：音声認識アルゴリズムのパラメータをトレーニングアルゴリズムに従って変更するステップは、さらに複数の閾値候補に対して誤った認識の統計を累積し；さらに、音声認識アルゴリズムの受理基準に対して、誤った認識の所定最大レートより小さい誤り認識レートを有する閾値候補を、閾値として選択することを特徴とする自動電話番号案内方法。１７．請求項１６の方法は：さらに名前ボキャブラリの各名前表示に対する誤り認識の統計を累積し；および、誤った認識の所定最大レートより大きい誤り認識レートを有する名前表示に、偽（デコイ）のラベルを付すステップを有することを特徴とする自動電話番号案内方法。１８．請求項１の方法において：トレーニングアルゴリズムに従って音声認識アルゴリズムのパラメータを変更するステップは、さらに、アプリオリ確率モデルに対してモデルパラメータを計算し、このアプリオリ確率モデルは、名前ボキャブラリの利用者の特定の名前の確率を、利用者の電話番号の関数と推定することを特徴とする自動電話番号案内方法。１９．請求項１８の方法において：モデルパラメータを計算するステップは、アプリオリ確率モデルに対してモデルパラメータを計算し、そのアプリオリ確率モデルは、名前ボキャブラリの利用者の特定の名前の確率を、利用者の電話番号のＮＰＡ−ＮＸＸ部分の関数と推定することを特徴とする自動電話番号案内方法。２０．請求項１８の方法において：モデルパラメータを計算するステップは、アプリオリ確率モデルに対してモデルパラメータを計算し、そのアプリオリ確率モデルは、名前ボキャブラリの利用者の特定の名前の確率を、利用者の電話番号と問い合わせ先の時刻の関数と推定することを特徴とする自動電話番号案内方法。２１．音声信号に応答して所望の動作を行う方法は：音声信号の表示を記憶し；音声信号の表示に応答する音声認識アルゴリズムに従って、音声信号が行動ボキャブラリの複数の行動の各々に対応する確率測度を計算し；計算された確率測度に応答して、行動ボキャブラリから行動を選択して、自動的にそれを実行し；所望の行動を示すデータをさらに得て；音声信号の表示と上記の他のデータに応答する音声認識アルゴリズムに従って、音声信号が複数の行動の各々に対応する確率測度をさらに計算し；上記のさらに計算された確率測度に応答して、記憶された音声信号の表示にラベルを付し；さらに、上記のラベルを付され記憶された音声信号の表示に応答して、音声認識アルゴリズムのモデルパラメータを計算することを特徴とする音声信号に応答して所望の動作を行う方法。２２．請求項２１の方法において：選択された行動のいくつかは、所望の情報の選択されたアイテムを提供することを特徴とする音声信号に応答して所望の動作を行う方法。２３．請求項２１の方法において：選択された行動を自動的に行うステップは、利用者に対して所望の行動を示す音声信号をさらに提供するように誘導し；およびデータをさらに得るステップは、さらなる音声信号に応答する音声認識アルゴリズムに従って、音声信号が行動ボキャブラリ中の複数の行動の各々に対応する確率測度を計算することを特徴とする音声信号に応答して所望の動作を行う方法。２４．請求項２３の方法において：利用者に対して音声信号をさらに提供するように誘導するステップは、さらに、利用者に対して、事前に分析された音声信号に応答して選択された所望の行動の確認／否認を行うように誘導することを特徴とする音声信号に応答して所望の動作を行う方法。２５．請求項２４の方法において：利用者に対して確認／否認を行うように誘導するステップは、事前に分析された音声信号に応答して選択された特定の行動によって、選択的に行われることを特徴とする音声信号に応答して所望の動作を行う方法。２６．請求項２１の方法において：所望の行動を示すデータをさらに得るステップは、事前に分析された音声信号に応答してオペレータが行う選択された特定の行動の否認をモニタすることを特徴とする音声信号に応答して所望の動作を行う方法。２７．請求項２６の方法において：オペレータが行う否認をモニタするステップは、事前に分析された音声信号に応答して選択された特定の行動を、手動で取り消す（オーバー・ライド）のをモニタすることを特徴とする音声信号に応答して所望の動作を行う方法。２８．請求項２６の方法において：オペレータが行う否認をモニタするステップは、さらに音声信号を受信して、音声認識アルゴリズムに従って、さらに得られた音声信号が、事前に分析された音声信号に応答して、選択された特定の行動の否認に対応する確率測度を計算することを含むことを特徴とする音声信号に応答して所望の動作を行う方法。２９．請求項２１の方法において：音声信号の表示と他のデータに応答する音声認識アルゴリズムに従って計算を行うステップは、音声信号の表示に応答する音声認識アルゴリズムに従って、音声信号が音声信号が限定された行動ボキャブラリの複数の行動の各々に対応する確率測度を計算し、上記の限定行動ボキャブラリは、さらに得られたデータに応答して選択された行動ボキャブラリのサブセットであることを特徴とする音声信号に応答して所望の動作を行う方法。３０．請求項２１の方法は：さらに、計算された音声認識モデルパラメータを、音声認識アルゴリズムを後に適用する際に使用することを特徴とする音声信号に応答して所望の動作を行う方法。３１．請求項２１の方法は：さらに、所望の行動を示す音声信号に対して、利用者を誘導する初期ステップを含むことを特徴とする音声信号に応答して所望の動作を行う方法。３２．電話番号案内を少なくとも部分的に自動化する装置において：少なくとも部分的に電話番号案内呼を処理し、所望の電話番号に関連する名前を利用者が発声するように誘導し、この誘導に応答して利用者から受信した音声信号の表示を問い合わせ記録に記憶し、さらに電話番号案内データベースより得られ検索された電話番号を問い合わせ記録に記録して、記憶された音声信号の各々の表示と検索された電話番号とを関連づけるオンラインプロセッサと、オンラインプロセッサによって生成された問い合わせ記録を処理し、問い合わせ記録に記憶され検索された電話番号に応答して音声認識アルゴリズムのパラメータを変更するように動作するオフラインプロセッサとを含むことを特徴とする自動電話番号案内装置。３３．請求項３２の装置において：オフラインプロセッサは、名前／番号データベースを検索して、検索された各電話番号から、それに対応する名前を少なくとも一つ派生し；音声認識アルゴリズムを実行して、選択され作成された上記名前を選択され記憶されている音声信号の表示と関連させ；さらに、選択された音声信号の表示とそれに関連する名前に応答するトレーニングアルゴリズムを実行して、音声認識アルゴリズムのパラメータを変更することを特徴とする自動電話番号案内装置。３４．請求項３３の装置において：オンラインプロセッサは、音声認識アルゴリズムを実行し、利用者から受信した音声信号が名前ボキャブラリ中の複数の名前の各々に対応する確率測度を計算し；さらにオフラインプロセッサは、トレーニングアルゴリズムに従って変更された音声認識アルゴリズムのパラメータを、オンラインプロセッサがアクセスするメモリにダウンロードするように動作することを特徴とする自動電話番号案内装置。３５．請求項３４の装置において：オンラインプロセッサは、計算された確率測度がもっとも高い名前に対応する複数の索引を、各問い合わせ記録に記憶するように動作し；さらに、オフラインプロセッサは、この名前の索引を使用して、音声認識アルゴリズムを実行し、選択され作成された名前と選択された音声信号の表示とを関連づけるように動作することを特徴とする自動電話番号案内装置。３６．請求項３３の装置において：オンラインプロセッサは、認識された名前に対応する索引を電話番号案内データベースに送出し、少なくとも部分的には電話番号案内データベースの検索を自動化するように動作することを特徴とする自動電話番号案内装置。３７．請求項３６の装置において：オンラインプロセッサは、電話番号案内データベースから送られてきた検索された名前を受信し、それを各問い合わせ記録に記録するように動作し；さらに、オフラインプロセッサは、上記の検索された名前を、検索された電話番号から作成された名前に加えることによって、音声認識アルゴリズムを実行して、選択され作成された名前と選択された音声信号の表示とを関連づけるように動作することを特徴とする自動電話番号案内装置。３８．請求項３２の装置において：オンラインプロセッサは、各問い合わせ記録に問い合わせ先の時刻を記憶するように動作し；さらに、オフラインプロセッサは、問い合わせ記録に記憶された問い合わせ時刻に応答して音声認識アルゴリズムのパラメータを変更するように動作することを特徴とする自動電話番号案内装置。３９．請求項３２の装置は：さらに、オンラインプログラム、問い合わせ記録およびオンライン音声認識モデルパラメータを記憶し、その問い合わせ記録は読み出しアクセス可能であり、オンライン音声認識モデルパラメータがオフラインプロセッサによって書き込み可能であるようなオンラインメモリと；オフラインプログラム、トレーニング記録、名前／番号データベースおよびオフライン音声認識モデルパラメータを記憶するオフラインメモリとを含むことを特徴とする自動電話番号案内装置。４０．請求項３９の装置は：さらに、オンラインプロセッサを交換電話網のスイッチにインタフェースするスイッチインタフェースと；オンラインプロセッサを電話番号案内データベースにインタフェースする電話番号案内データベースインタフェースとを含むことを特徴とする自動電話番号案内装置。４１．請求項４０の装置は：さらに、スイッチインタフェースを介してオンラインプロセッサに接続された交換電話網のスイッチと；電話番号案内データベースインタフェースを介してオンラインプロセッサに接続される電話番号案内データベースと；スイッチインタフェースとスイッチを介してオンラインプロセッサに接続され、前記スイッチを介して電話番号案内データベースに接続されるオペレータ台コントローラと；オペレータ台コントローラに接続された少なくとも一つのオペレータ台とを含むことを特徴とする自動電話番号案内装置。４２．請求項４１の装置は：さらに、電話番号案内データベースとスイッチに接続され、電話番号案内の利用者に電話番号記載事項の検索された電話番号を音声で知らせる音声応答ユニットを含むことを特徴とする自動電話番号案内装置。４３．請求項３９の装置は：操作可能なようにオフラインプロセッサに接続される複数のオンラインプロセッサを含み、各オンラインプロセッサは関連するオンラインメモリを有することを特徴とする自動電話番号案内装置。