JP5051945B2

JP5051945B2 - 通話者入力レート制御方法、通話者入力レート制御システム、及び通話者入力レート制御装置

Info

Publication number: JP5051945B2
Application number: JP2001092258A
Authority: JP
Inventors: アランジョンソンマーク
Original assignee: アルカテル−ルーセントユーエスエーインコーポレーテッド
Priority date: 2000-03-29
Filing date: 2001-03-28
Publication date: 2012-10-17
Anticipated expiration: 2021-03-28
Also published as: US6728671B1; MXPA01003126A; EP1139334A2; EP1139334B1; DE60123696D1; DE60123696T2; EP1139334A3; CA2337368C; JP2001320490A; CA2337368A1

Description

【０００１】
【発明の属する技術分野】
本発明は自動音声認識システムに関し、特に、インタラクティブ情報通信システムにおいて用いられる自動音声認識システムに対する通話者の入力レートを制御する装置、方法及びシステムに関する。
【０００２】
【従来の技術】
自動音声認識システムは、種々のインタラクティブ通信及びその他のサービスにおいて幅広く用いられるようになってきている。例えば、自動音声認識システムは、航空会社フライト情報システム、音声ダイアル通信システム、及び（音声合成を利用する）電子メール読み出しなどのインタラクティブシステムにおける可聴音プロンプトに対する音声応答を認識する目的で用いられている。
【０００３】
しかしながら、自動音声認識システムは、通常３２から６４という、限られた固定数の入力チャネルしか有していない。従来技術に係る音声認識システムは、これら入力チャネルを通話者（あるいは他のユーザ）当たりに割り当てる。結果として、全ての入力チャネルが使用中であると、その後の通話者は、通常、入力チャネルが利用可能になるまでの間、保留される。ある種のシステムは、保留にしている通話者宛に音楽あるいはアナウンスを提供し、別の種類のシステムは、通話者に、通話者が待ち行列におかれていることに係る情報を提供する。より混雑が激しくなった場合には、利用者は、別の時刻に再度電話をかけるように通知され、その通話が切断されることになる。
【０００４】
【発明が解決しようとする課題】
残念ながら、過負荷状況に対するこの種の通話保留あるいは通話切断は、利用者に、通常不満あるいはいらだちを起こさせる。通話者は、通常、待ち行列におかれることを好まず、さらには憤慨する可能性もある。従って、サービスプロバイダは、利用者のサービス要求を、タイムリーに、ユーザフレンドリーに、効率的に、かつ、対費用効果がよくなるように充足させることを望んでいる。
【０００５】
従って、通話者入力チャネルの固定数を増加させることなく自動音声認識システムの容量を増大させる装置、方法及びシステムを実現する要求が存在する。このようにして増大させられた容量は、ユーザに対して透過的で、ユーザフレンドリーで、かつ、混雑すなわち過負荷状況の場合に利用者に対して実質的に認識不能であるべきである。このようにして増大させられた容量は、既存の自動音声認識システムにおいて、通話者入力チャネルの固定数に拘わらずに容量を増大し、対費用効果が望ましいものであるように実装されることが可能であるべきである。
【０００６】
【課題を解決するための手段】
本発明の種々の実施例は、自動音声認識（ＡＳＲ）システムの容量を、主として二つのタイプの機能、すなわち、コンセントレータ機能及び遅延機能、を実行することによって増大させる。本発明に係るコンセントレータ機能は、アクティブな通話者入力チャネルのみを音声認識目的のＡＳＲ入力チャネルに切り替えること（すなわち、通話者がサービスプロバイダのメッセージを聞いているような出力（再生）モードのみに関してアクティブであるチャネルに対してＡＳＲ機能を提供しないあるいは予約しないこと）によって、より多くの個数の通話者入出力（Ｉ／Ｏ）チャネルが用いられることを可能にする。遅延機能は、起こりうる過負荷状況に係るものであり、出力（再生）モードの持続時間を増加させるように実装されており、そのことによって、通話者が聞いているだけの時間を増加させ、従って、入力ＡＳＲチャネルが他の通話に係る音声入力を認識する（及び、望むらくは、より多くの通話量を処理する）目的で用いられる時間をより多く実現する。遅延機能は、入力プロンプトとして通話者に対して再生されるメッセージの持続時間を増大させること、及び、通話者に対して再生される種々のメッセージの開始部あるいはその途中に無音期間を挿入すること、のいずれかあるいはその双方の遅延タイプを用いて実装されることが望ましい。
【０００７】
自動音声認識に係る本発明に従った通話者入力レート制御を有する望ましいインタラクティブ通信システムは、第一に、入力チャネル及び出力チャネルを有するネットワークインターフェース；第二に、出力チャネル上のメッセージ出力に係る出力モジュール；第三に、ＡＳＲ入力チャネルを有する自動音声認識モジュール；及び、入力チャネル、出力モジュール及びＡＳＲ入力チャネルに対して接続された通話者入力レート制御モジュールを有している。通話者入力レート制御モジュールは、ＡＳＲ入力チャネルの利用レベル（利用度）を決定するインストラクションを有しており、ＡＳＲ入力チャネルの利用度が所定の第一閾値よりも大きい場合には、出力モジュールに、出力チャネル上のメッセージ出力に対して関連する遅延モードを実現するように指示する。
【０００８】
通話者入力レート制御モジュールは、入力チャネルのエネルギーレベルをモニターし、直前の時間期間において入力チャネルから受信した入力の全てをメモリバッファにストアしてバッファ済み情報を構成することによって、コンセントレータ機能を実現する。与えられた入力チャネルのモニターされたエネルギーレベルが所定のエネルギーレベルよりも大きい場合には、通話者入力レート制御モジュールはバッファ済み情報をＡＳＲ入力チャネルに送信し、音声認識目的でその入力チャネルをＡＳＲ入力チャネルに接続する。
【０００９】
通話者入力レート制御モジュールは、複数個のメッセージ持続期間からあるメッセージ持続期間を選択すること、及び、複数個の無音持続期間からある無音持続期間を選択すること、を個々に行なうかあるいは組み合わせて行なうことによって、関連する遅延モードを決定する。関連する遅延モードは、ＡＳＲ入力チャネルの利用度に比例するか、あるいは、ＡＳＲ入力チャネルの利用度の範囲あるいは増分に対応する。
【００１０】
本発明に係る種々の利点には、全てのＡＳＲ入力チャネルが他の通話者に対してサービスを提供するために占有されている場合においても、通話者を保留にしたり通話を切断することなく、インタラクティブシステムによって通話者に対して実際にサービスが提供されることが含まれる。第二に、本発明の種々の実施例は、与えられたあるいは固定された個数のＡＳＲ入力チャネルを増大を要求することなくＡＳＲシステムの容量を増大させ、既存のＡＳＲ入力チャネルをより効率的に利用させる。加えて、ＡＳＲ入力チャネルをより効率的にりようすることによって、実際の通話者待機時間が減少し、より長い持続時間を有するプロンプトあるいはメッセージを介して通話者にサービスを提供し続けることによって、見かけの待機時間も減少する。最後に、本発明によって実現された容量の増大はユーザに対して透過的であり、ユーザフレンドリーであり、混雑すなわち過負荷状態における利用者にとっては実効的に認識不能であり、及び、既存の自動音声認識システムにおいて対費用効果を充分に有するように実装されることが可能である。
【００１１】
【発明の実施の形態】
本発明の実施例には種々の変形例が考えられるが、以下、本明細書においては、特定の実施例に関連して詳細に図示及び記述される。本明細書における技術開示は本発明の原理を例示するものであり、本発明を例示された特定の実施例に限定するものではないことに留意されたい。
【００１２】
前述されているように、自動音声認識（“ＡＳＲ”）システムの容量を増大させることに対する要求が依然として存在する。本発明に従って、与えられたあるいは固定された数のＡＳＲ入力チャネルの対応する増加を要求することなく、この種のＡＳＲ容量を増大させる装置、方法及びシステムが以下に例示される。加えて、本発明に従って実現された容量増大は、ユーザに対して透過的であり、ユーザフレンドリーであり、混雑すなわち過負荷状態における利用者にとっては実効的に認識不能である。本発明の種々の実施例は、ＡＳＲシステムの実際の待機時間及び見かけの待機時間（及び／あるいは保留時間）の双方を減少させ、ユーザ及びサービスプロバイダの満足感を増大させる。本発明によって実現されたシステム容量増大は、既存の自動音声認識システムにおいて高い対費用効果で実装されることが可能であり、与えられた、既存の個数のＡＳＲ通話者入力チャネルをより効率的に利用することが可能になり、及び、ＡＳＲ通話者入力チャネルの個数及び対応する資本支出の増加を必要とすることなく、システム容量増大を実現する。
【００１３】
本発明は、自動音声認識を利用するインタラクティブ通信システムに係る種々の経験的な観察結果を活用する。より詳細に述べれば、この種のインタラクティブシステムにおいては、通話者が、サービスプロバイダからのプロンプト、メッセージあるいは他の情報を聞いている種々の時間期間が存在し、これらの時間期間の間は全ての対応するＡＳＲ入力チャネルがアイドル状態にあって、現時点でのプロンプトあるいはメッセージに対する通話者からの応答を待機している。本発明は、このような、従来技術においてはＡＳＲのアイドル期間であったものを、以下に議論されるコンセントレータ機能を用いて、他の通話者に対する音声認識サービスを実現する目的で利用する。加えて、混雑すなわち過負荷になっている時間期間においては、本発明は、以下に議論される遅延機能を用いて、通話者に対して再生されるメッセージ（プロンプト）の持続時間を修正して増大させ、このことによって、通話者が聞いているだけの時間を透過的に増大させる。結果として、本発明の種々の実施例は、通話者に対するサービス供給を継続しつつ、同時に、ＡＳＲ入力チャネルに係るより多くの時間が他の通話に対して用いられることを必要に応じて可能にし、この種の制限されたＡＳＲ入力チャネル数に起因する過負荷すなわち“ボトルネック”状況を減少させる。
【００１４】
本発明の種々の実施例においては、プロンプトあるいは他のメッセージの持続時間が、単一あるいは複数個のメッセージの持続時間をより長くすること及びメッセージ間の無音時間期間を増大させることの双方によって、通話者にとって知覚不能であるように、増加させられる。この時間の間、ＡＳＲ入力チャネルは、例えば、対応するプロンプトあるいは他のメッセージに対して音声応答している通話者のような他のアクティブ通話に係る音声認識に関して用いられる。あらゆる持続時間のプロンプトの後に、利用者が発話することによって応答する場合には、利用可能なＡＳＲ入力チャネルがその応答の認識に対して利用され、その応答の後には、ＡＳＲ入力チャネルが再び他の通話者の応答認識に関して利用可能になる。
【００１５】
それゆえ、本発明に従って、利用者は、全てのＡＳＲ入力チャネルが他の利用者に対してサービスを提供しているためにビジー状態である場合においても、保留されたり通話を切断されたりすることなく、実際にインタラクティブシステムによってサービスを提供されることになる。結果として、本発明の種々の実施例は、既存のＡＳＲ入力チャネルをより効率的に利用すること及び“負荷時の上品な低下”として当業者には既知の手法を実現することの双方によって、ＡＳＲシステム容量を増大させる。加えて、ＡＳＲ入力チャネルをより効率的に用いることによって、通話者にとっての実際の待機（あるいは保留）時間が減少し、より長い持続時間を有するプロンプトあるいはメッセージを介して通話者にサービスを提供し続けることによって、見かけの待機時間も減少する。
【００１６】
図１は、本発明の実施例に従って自動音声認識通話者入力レート制御を実現するシステム１００及び装置２００を示すブロック図である。図１に示されているように、インタラクティブシステム１００は、ネットワークインターフェース１６０、出力（すなわち再生）モジュール２５０、通話者入力レート制御モジュールあるいは装置２００、自動音声認識（ＡＳＲ）システム（コンポーネントあるいはモジュール）２４０、及び、オプションとしての通話制御モジュール２４５を有している。通話制御モジュール２４５は、例えば航空会社フライト情報、株価市況サービス、電子メール読み上げ、あるいは音声ダイアルなどの選択されたサービスに対応して、（例えば航空機の到着時刻あるいは株価市況などの）選択された情報を供給し、電子メールメッセージを読み上げ、あるいは、（電話のダイアリングなどの）他の選択されたサービスを実行する。ネットワークインターフェース１６０は、出力モジュール２５０から通話者に対するメッセージあるいはプロンプトの再生する出力や、通話者の音声を通話者入力レート制御装置２００及びＡＳＲ２４０へ供給する入力として機能する、システム１００の通話者入出力（“Ｉ／Ｏ”）を実現する。
【００１７】
ネットワークインターフェース１６０は、公衆交換電話網（“ＰＳＴＮ”）、総合デジタルサービス網（“ＩＳＤＮ”）あるいは他のデジタルネットワーク、及び／あるいはインターネットなどのパケットベースネットワークなど、単一あるいは複数個のネットワーク１１０に接続されている。ネットワーク１１０は、（有線あるいは無線の）交換センター１１５、ルータ１２０、及びサーバ１２５からなる種々のシステムに接続されており、これらは、電話機１４０（あるいは他の利用者邸内装置）、（基地局１３５経由の）モバイルユニット１３０（例えばセルラ電話機あるいはＰＣＳ電話機）、及びコンピュータ１４５（あるいは他のネットワークアクセスデバイス）などを介して、通話者と他の利用者との間の通信を実現する。これらのあらゆる種々の通信メディアを介して、通話者あるいは他の利用者は、航空会社フライト情報、音声ダイアリング、あるいは電子メール読み出しなどのインタラクティブＡＳＲサービスを利用するためにシステム１００にアクセスする。
【００１８】
図１において、ＡＳＲ２４０は、種々のプロンプトに対する通話者の応答の認識などの音声認識を実行する。ＡＳＲ２４０は、通常、図１のバス２１５部分に示されているように、固定数、例えば“Ｓ”個の入力チャネルを有している。本発明に従って、システム１００により大きな容量を実現する目的で、ネットワークインターフェース１６０がＡＳＲ２４０に非悪してより多くの個数のＩ／Ｏチャネル、例えば“Ｒ“個のＩ／Ｏチャネルを有している（各Ｉ／Ｏ対を１チャネルと数え、この際にＲ＞Ｓである（図１のバス１６５に示されているように、Ｒ個の入力チャネルが装置２００に対してバス２２５を介して接続されており、Ｒ個の出力チャネルがバス２３５を介して出力モジュール２５０に接続されている））。
【００１９】
通話制御モジュール２４５は、選択されたサービスに応答して、ＡＳＲ２４０から受信された入力に従って種々のサービスを実現する。例えば、ＡＳＲ２４０からの認識された音声に依存して、通話制御モジュール２４５は、（出力モジュール２５０の）メッセージ選択モジュール２５５に、航空会社のフライト番号を要求するプロンプトを提供させ、その後の音声認識に従って、通話制御モジュール２４５が特定のフライトに係る情報に関してデータベース（図示せず）をアクセスして、出力モジュール２５０に対応するフライトの到着あるいは出発時刻に係る出力を（ネットワークインターフェース１６０）を介して出力させる。
【００２０】
本発明に従って、通話者入力レート制御装置２００は、オブザーバモジュール２３０、プロセッサ２１０、及びメモリ２２０を有することが望ましい。オブザーバモジュール２３０は、エコーキャンセラ及びエネルギーデテクタを有している。オブザーバモジュール２３０のエコーキャンセラ部分は、ネットワークインターフェース１６０の入力において検出された発信メッセージからあらゆるエコーを除去する。オブザーバモジュール２３０のエネルギーデテクタ部分は、ネットワークインターフェース１６０の複数個の入力チャネル２２５の各々におけるエネルギー（すなわち、電力と等価である）を検出する目的で用いられ、通話者が話し始めたこと、すなわち、対応する入力チャネルがＡＳＲ２４０による音声認識によって処理されるべきであることを示す。本発明の望ましい実施例においては、オブザーバモジュール２３０は、−４０ｄＢｍの背景雑音レベルに対しては、およそ−３０ｄＢｍでのエネルギー検出を実行する。メモリ２２０は、例えば種々のタイプのランダムアクセスメモリ（ＲＡＭ）、ＤＲＡＭ、ＳＲＡＭあるいはＭＲＡＭなどのデータストレージ集積回路（“ＩＣ”）、あるいは他の回路あるいは装置であって、（少なくともその一部が）サーキュラーバッファとして実装されていることが望ましい。本発明の望ましい実施例においては、メモリ２２０は、全ての入力チャネル２２５からの所定の量の（音声あるいは無音の）最新のサンプルをストアする。通話者からの音声の損失を防止する目的で、オブザーバモジュール２３０があらゆる与えられた入力チャネル２２５上でエネルギー（入力音声）を検出した際には、その入力チャネルに対応するストアされた（音声）サンプルが、当該チャネル上の現在の全ての入力音声に加えて、ＡＳＲ２４０に対して認識目的で送出される。結果として、（検出されたエネルギーレベルによって表わされているように）入力チャネルがアクティブの場合にのみネットワークインターフェース１６０からの入力チャネルをＡＳＲ２４０に対して接続する（すなわち、ネットワークインターフェース１６０からの入力チャネルをオブザーバ２３０及びメモリ２２０を介してＡＳＲ２４０に接続する）ことによって、装置２００のオブザーバモジュール２３０及びメモリ２２０は（プロセッサ２１０と共に）コンセントレータ機能を有することになり、ＡＳＲ２４０の入力チャネル数（Ｓ）と比較してより大きな個数（Ｒ）の入力チャネル２２５が用いられることが可能になり、よって、（ＡＳＲ２４０の入力チャネル数を増加させることなく）システム１００の容量を増大することが可能になる。
【００２１】
図１では、装置２００のプロセッサ２１０は、単一の集積回路（“ＩＣ”）を含むか、あるいは、例えばマイクロプロセッサ、デジタルシグナルプロセッサ（“ＤＳＰ”）、アプリケーションスペシフィック集積回路（“ＡＳＩＣ”）、フィールドプログラマブルゲートアレイ（“ＦＰＧＡ”）、関連するメモリ（例えばＲＡＭ、ＤＲＡＭ、ＳＲＡＭ、ＭＲＡＭ及びＲＯＭ）、及び他のＩＣ及びコンポーネントなどによって構成された複数個の集積回路及び他のコンポーネントを含んでいる。結果として、本明細書においては、プロセッサという術語は、関連するメモリ、例えばマイクロプロセッサメモリあるいは外部ＲＡＭ、ＤＲＡＭ、ＳＲＡＭ、ＭＲＡＭ、ＲＯＭ、ＥＰＲＯＭ、Ｅ²ＰＲＯＭなどと共に機能する単一のプロセッサ、あるいは、プロセッサ、マイクロプロセッサ、コントローラなどからなる配置、前述及び図２から図４に関連して以下に詳述される機能を実行する他のある種の集積回路群を等価的に意味していて含んでいることに留意されたい。前述及び図２から図４に関連して以下に詳述される本発明に係る方法論は、プログラムされ、プロセッサ２１０及びその関連するメモリ（及び／あるいはメモリ２２０）及び他の等価なコンポーネントに、プロセッサ２１０が動作している（すなわち、電源が投入されていて機能している）際に実行されるプログラムインストラクション（あるいは等価な配置もしくはプログラム）の組としてストアされる。（言い換えれば、プロセッサ２１０及びその関連するコンポーネント及び他の等価なコンポーネントが、全体としてあるいはその一部がＦＰＧＡ及び／あるいはＡＳＩＣに実装されている場合には、ＦＰＧＡあるいはＡＳＩＣが、本発明の方法論を実装するように設計されて配置あるいは配線されている。）本発明の望ましい実施例においては、プロセッサ２１０は、オブザーバモジュール２３０及びＡＳＲ２４０の機能を実装していて実行する。
【００２２】
前述されたコンセントレータ機能の促進及び増大に加えて、プロセッサ２１０は本発明に係る種々の遅延機能を実現する。例えば、ＡＳＲ２４０の入力チャネルの利用度合に基づいて、プロセッサ２１０は、例えば無遅延、軽（低）遅延、中庸（中間）遅延、あるいは重（高）遅延といった種々の遅延モードを選択することが可能である。前述されているように、本発明は、（出力モジュール２５０を介して）通話者に再生されるプロンプトあるいは他のメッセージの持続時間の増大、及び、これらプロンプトあるいは他のメッセージ中の無音期間の持続時間の増大、という二つのタイプの遅延機能を利用する。これら二つのタイプの遅延機能は、互いに独立に実装されることが可能であり、また、個々にあるいは互いに組み合わせて実装することも可能である。以下に詳細に議論されるように、この種の遅延機能は連続的（図２）あるいは漸増的（図３）に実装されうる。加えて、このような遅延機能は、進行中の全ての通話に係る連続的に実行されるプロセスとして実装されることが可能であり、また、（通話毎に）受信した各通話に関して実装されることも可能である。
【００２３】
本発明の望ましい実施例における、プロセッサ２１０による遅延実現の一つの形態は、出力モジュール２５０によって再生されるメッセージ（あるいはプロンプト）内の無音期間の持続時間の増大である。例えば、プロンプトの開始部における５０から２０００ミリ秒のオーダーの遅延（すなわち、開始部の無音期間）は、一般的には利用者に認識されない。種々の持続時間を有する他の無音期間も、メッセージあるいはプロンプト中に用いられる発話間に挿入可能である。本発明の望ましい実施例においては、この種の付加すなわち挿入される無音期間が、メッセージ／プロンプトの開始部に用いられ、さらに、ある程度（対応するメッセージあるいはプロンプトが、ぎこちなくあるいは人工的ではなく、受認可能であると認識され続ける程度）はメッセージ／プロンプト内で用いられる。
【００２４】
本発明の望ましい実施例においては、利用者に対する透過性を最大にする目的で、選択されたサービスに関して通話者に対して供給される（プロンプトなどの）メッセージが、種々の相異なった持続時間を有する一連の（シリーズ）メッセージとして予め録音されている。これらは、出力モジュール２５０を介して、ネットワークインターフェース１６０のＩ／Ｏチャネルの出力部分で出力（再生）される。例えば、望ましい実施例においては、四つのメッセージシリーズが、四つの対応する遅延モード（例えば、無遅延、低遅延、中間遅延、及び高遅延モード）に対応して予め録音されている。シリーズ中の最初のメッセージは無遅延状況に関して録音されている；第二のメッセージは、低遅延すなわち軽遅延向けに、対応する最初のメッセージよりも少し長い持続時間で録音されている；第三のメッセージは、中間遅延すなわち中庸遅延向けに、対応する第二のメッセージよりも少し長い持続時間で録音されている；及び、第四のメッセージは、高遅延すなわち重遅延向けに、対応する第三のメッセージよりも少し長い持続時間で録音されている。これら一連のメッセージは、出力モジュール２５０中のメッセージあるいはプロンプトメモリ２６０にストアされていることが望ましい。
【００２５】
本発明の望ましい実施例においては、二つのタイプの遅延機能が、個々に、あるいは種々の組み合わせで、もしくは互いに独立に実装されうる。例えば、第一の遅延モードは、メッセージの開始部における第一の（短い）無音期間の利用のみから構成され、（付加されたメッセージ持続時間を有さない）第一メッセージシリーズから選択される。第二の遅延モードは、第二シリーズ（低遅延メッセージ）から選択されたメッセージの利用のみから構成される。第三の遅延モードは、開始部における短い無音期間と第二シリーズ（低遅延メッセージ）から選択されたメッセージの利用の双方からなる。第四の遅延モードは、第三シリーズ（中間遅延メッセージ）から選択されたメッセージの利用のみから構成され、第五の遅延モードは、増大無音期間及び第三シリーズ（中間遅延メッセージ）の組み合わせよりなる等々である。二つのタイプの遅延機能は、本発明に従った通話者入力レート制御に係る遅延機能を実現するためのあらゆる望ましい粒度あるいは連続性を実現する目的で、無限の組み合わせで選択されうる。
【００２６】
前述されているように、ＡＳＲ２４０の入力チャネルの利用の度合に基づいて、プロセッサ２１０は、例えば無遅延、低遅延、中間遅延、あるいは高遅延などの種々の遅延モードを選択する。望ましい実施例に依存して、ＡＳＲ２４０の入力チャネルの利用度の測定及び種々の遅延モードの双方は、（近似的に）連続的に、あるいは漸増的に実装される。加えて、選択された遅延モードは、現在進行中の全ての通話に対して、あるいは、現在着信した通話のみに対して、適用可能である。
【００２７】
近似的に連続的な実施例では、サービスプロバイダは、ＡＳＲ２４０の入力チャネル利用度が７５％の場合（すなわち、ＡＳＲ２４０の入力チャネルの総数のうちの７５％が現在利用されている場合）を閾値として、種々の遅延モードの実装を開始する。より多くのＡＳＲ２４０入力チャネルが用いられると、現在進行中の全ての通話に関して、対応した関連する遅延モードが用いられる。このような実装例が、図２に関連して例示される。
【００２８】
現在進行中の全ての通話に対して適用可能な漸増的実施例においては、サービスプロバイダは、ＡＳＲ２４０入力チャネルの利用度の範囲に依存して、種々の遅延モードの実装を開始する。例えば、ＡＳＲ２４０入力チャネルの利用度が７５％、すなわち、第一閾値である場合、（次の閾値に到達するまで）低遅延モードが用いられる。ＡＳＲ２４０入力チャネルの利用度が増加して第二閾値、例えば８３％に達した場合には、システムは中間遅延モードの利用を開始する。ＡＳＲ２４０入力チャネルの利用度がさらに増加して第三閾値、例えば９０％に達した場合には、システムは高遅延モードの利用を開始する。結果として、種々の漸増的な遅延モードの利用は、ＡＳＲ２４０入力チャネルの利用度の範囲に対応して、例えば、無遅延モード（利用度が０から７４％）、低遅延モード（利用度が７５％から８２％）、中間遅延モード（利用度が８３％から８９％）、及び高遅延モード（利用度が９０％から１００％）となる。この種の実装は、図３に例示される。
【００２９】
遅延モードは、図２及び図３に示されているように、現在進行中の全ての通話に対して適用可能な連続実行プロセスとしても実装されうる。加えて、遅延モードは、以下に図４に示されているように、各々の着信通話に関して通話毎に実装されうる。
【００３０】
再度図１に戻れば、通話者入力レート制御装置２００は、コンセントレータ機能及び遅延機能という二つのタイプの機能を実行することによって、ＡＳＲシステム１００の容量の増大を実現する。装置２００のコンセントレータ機能は、アクティブな入力チャネルのみを音声認識目的でＡＳＲ２４０に接続すること（すなわち、通話者がサービスプロバイダのメッセージを聞いているだけの出力（再生）モードのみでアクティブになっているチャネルにＡＳＲ機能を提供あるいは予約しないこと）によって、より多くのＩ／Ｏチャネルが用いられることを可能にする。起こりうる過負荷状況に対する付加遅延機能は、出力（再生）モードの持続時間を増加させるように実装され、通話者が聞いている時間を増加させ、従って、入力ＡＳＲチャネルに他の通話における音声入力の認識目的で（さらには、より大量の通話を処理する目的で）利用されるより多くの時間を提供する。
【００３１】
図２は、本発明に従った自動音声認識通話者入力レート制御を実現する第一の実施例を示す流れ図である。当該方法は、連続実行プロセス（すなわちループ）として（プロセッサ２１０内で）機能する（段階３００）。本方法は（プロセッサ２１０によって）、まず、段階３０５において、例えば使用中のＡＳＲ２４０入力チャネルの個数を決定すなわち数えることによって、ＡＳＲ２４０入力チャネルの利用度を決定する。次に、段階３１０において、本方法は、ＡＳＲ２４０入力チャネルの利用度が所定の第一閾値、例えば前述された７５％、より大きいか否かを決定する。段階３１０において、ＡＳＲ２４０入力チャネルの利用度が所定の第一閾値よりも大きい場合には、本方法は（プロセッサ２１０によって）、段階３１５において、ＡＳＲ２４０入力チャネルの利用度に比例した通信遅延モードを実現する。前述されているように、この種の遅延モードは（近似的に）連続的であり、無音期間の増大とより長い持続時間のメッセージとによる前述された種々の組み合わせを利用する。遅延モードは、現在進行中の全ての通話に対しても適用される。このような遅延モードは、プロセッサ２１０から出力モジュール２５０への指示すなわちコマンドによって実装される。
【００３２】
段階３２０では、本方法は、ＡＳＲ２４０入力チャネルがいくつ使用中であるか、すなわち現在の利用度、を再び決定する。これは、複数の通話が終了し、また、着信されているからである。本発明の望ましい実施例においては、遅延モードはヒステリシスを有するような形態で、すなわち、利用中のＡＳＲ２４０入力チャネルの個数が、前記第一閾値よりも低く設定された第二閾値、例えば第一閾値が利用度７５％の場合には６５％利用度という第二閾値、よりも低下するまで、継続される。従って、段階３２０におけるＡＳＲ２４０入力チャネルの現在の利用度の決定に引き続いて、本発明は、段階３２５において、ＡＳＲ２４０入力チャネル利用度が所定の第二閾値未満に低下したか（あるいは低下しているか）否かを決定する。段階３２５において、ＡＳＲ２４０入力チャネル利用度が所定の第二閾値未満に低下した（あるいは低下している）場合（すなわち、使用中のＡＳＲ２４０入力チャネル個数が段階３１０における所定の第一閾値よりも大きくない場合）には、本発明は、段階３３０において、無遅延モードに戻る（あるいは無遅延モードに留まる）。（現在使用中のＡＳＲ２４０入力チャネルの個数で表わされる）利用度が段階３２５において所定の第二閾値未満に低下していない（あるいは第二閾値未満ではない）場合には、本方法は関連する（すなわち、この場合には、比例した）遅延モードを実現し続け、段階３１５へ戻る。段階３３０において無遅延モードに復帰した後、本方法は段階３０５へ戻り、ＡＳＲ２４０入力チャネルの利用度を継続してモニターする。
【００３３】
図３は、本発明に従った自動音声認識通話者入力レート制御を実現する第二の実施例を示す流れ図である。この第二の方法においては、四つの遅延状態（漸増）、すなわち、無遅延、低遅延、中間遅延、及び高遅延、が、ＡＳＲ２４０入力チャネルの利用度に係る閾値（及び対応する範囲）に基づいて用いられる。加えて、ヒステリシスを実現するような閾値が、より高い遅延状態からより低い遅延状態に遷移する際に利用される。与えられたあるいは選択された遅延モードが、現在進行中の全ての通話に対して適用される。さらに、この第二の方法においては、ＡＳＲ２４０入力チャネルの利用度決定が、種々の閾値比較段階（すなわち、以下に議論される段階４０５、４３０、４４０、４６５、４７０、４８０、５０５、５１０及び５１５）に内在しており（すなわち、それらと組み合わせられており）、それゆえ、個別の段階としては例示されない。（ＡＳＲ２４０入力チャネルの利用度決定は、プロセッサ２１０内のカウンタの利用などの当業者には公知の様々な方法によって実現されうるものであり、実際の結果の数値の出力を必要としない。例えば、この決定は、利用度のパーセンテージあるいは比率である場合があり、また、カウントである場合がある等々である。結果として、この決定段階は、図２に関して前述されているような、ＡＳＲ２４０入力チャネルの現在の利用度の決定のように広義に解釈されるべきである。）図２に示された方法と同様、図３に示された方法はプロセッサ２１０において、あらゆる遅延モードがプロセッサ２１０から出力モジュール２５０への指示すなわちコマンドを用いるように実装される。
【００３４】
本発明に係る第二の方法は、（プロセッサ２１０内で）連続実行プロセス（すなわち、ループ）として機能する（段階４００）。当該方法は、段階４０５において、ＡＳＲ２４０入力チャネルの利用度が所定の第一（高）閾値、例えば前述された９０％、より高いか否かを決定する。段階４０５において、ＡＳＲ２４０入力チャネル利用度が当該第一（高）閾値よりも高い場合には、本方法は高遅延モードを実現し、段階４１０へ進む。段階４０５において、ＡＳＲ２４０入力チャネル利用度が当該第一（高）閾値よりも高くない場合には、本方法は、段階４４０において、ＡＳＲ２４０入力チャネル利用度が所定の第二（中間）閾値、例えば前述された８３％、より高いか否かを決定する。段階４４０において、ＡＳＲ２４０入力チャネル利用度が当該第二（中間）閾値よりも高い場合には、本方法は中間遅延モードを実現し、段階４４５へ進む。段階４４０において、ＡＳＲ２４０入力チャネル利用度が当該第二（中間）閾値よりも高くない場合には、本方法は、段階４８０において、ＡＳＲ２４０入力チャネル利用度が所定の第三（低）閾値、例えば前述された７５％、より高いか否かを決定する。段階４８０において、ＡＳＲ２４０入力チャネル利用度が当該第三（低）閾値よりも高い場合には、本方法は低遅延モードを実現し、段階４８５へ進む。段階４８０において、ＡＳＲ２４０入力チャネル利用度が当該第三（低）閾値よりも高くない場合には、本方法は、無遅延モード（段階５２５）に留まり（すなわち戻り）、段階５２５に引き続いて、本方法はＡＳＲ２４０入力チャネル利用度のモニターを継続して、段階４０５へ戻る。
【００３５】
段階４０５において、ＡＳＲ２４０入力チャネル利用度が所定の第一（高）閾値より高い場合には、本方法は高遅延モードを実現し、段階４１０へ進む。段階４１０では、本方法は、高遅延モードに関して第一の遅延タイプ（無音期間）がイネーブルされているか否か、すなわち、無音期間の持続時間の漸増の利用がイネーブルされているか否か、を決定し、その場合には、本方法は、段階４１５において、高遅延モードの実現に際して対応する（高すなわち最長）持続時間を有する無音期間を利用する。段階４１５に引き続いて、あるいは、段階４１０で無音期間の持続時間の漸増の利用がイネーブルされていない場合には、本方法は段階４２０へ進み、高遅延モードに関して第二の遅延タイプ（メッセージ持続期間）がイネーブルされているか否か、すなわち、高持続時間（比較的最長）の一連のメッセージあるいはプロンプトの利用がイネーブルされているか否か、を決定する。段階４２０において、一連の高持続時間メッセージの利用がイネーブルされている場合には、本方法は、段階４２５において、高遅延モードの実現に際して一連の高持続時間メッセージを利用する。
【００３６】
段階４２５に引き続いて、あるいは、段階４２０において一連の高持続時間メッセージの利用がイネーブルされていない場合には、本方法は段階４３０へ進み、ＡＳＲ２４０入力チャネル利用度が（通話が終了されたために）所定の第四閾値未満に低下したあるいは低下しているか否かを決定する。望ましい実施例においては、所定の第四閾値は、より短い遅延のモードへ移行する前にヒステリシス特性を実現する目的で、前記所定の第一閾値と第二閾値との間のレベルにセットされる。段階４３０におけるＡＳＲ２４０入力チャネル利用度が所定の第四閾値未満に低下していない（すなわちより大きい）場合には、本方法は高遅延モードを維持し（段階４３５）、段階４３０に戻ってＡＳＲ２４０入力チャネル利用度のモニターを継続する。段階４３０におけるＡＳＲ２４０入力チャネル利用度が所定の第四閾値未満に低下した（あるいは低下している）場合には、本方法は段階４４０へ進み、本方法が中間遅延あるいは低遅延モードへ進むべきか否かを決定する。
【００３７】
図３において、段階４０５あるいは４３０に引き続いて、段階４４０においてＡＳＲ２４０入力チャネル利用度が所定の第二閾値（中間レベル）よりも大きい（しかしながら、段階４０５において、所定の第一閾値よりは大きくない）場合には、本方法は中間遅延モードを実現し、段階４４５へ進む。段階４４５においては、本方法は、中間遅延モードに対して第一遅延タイプ（無音期間）がイネーブルされているか否か、すなわち、無音期間増大の利用がイネーブルされているか否か、を決定し、その場合には、本方法は、段階４５０における中間遅延モードの実現に際して、無音期間の対応する（中間的な）持続時間を利用する。段階４５０に引き続いて、あるいは、段階４４５において無音期間増大の利用がイネーブルされていない場合には、本方法は段階４５５へ進み、第二遅延タイプ（メッセージ持続時間）が中間遅延モードに対してイネーブルされているか否か、すなわち、一連の中間的な持続時間を有するメッセージあるいはプロンプトの利用がイネーブルされているか否か、を決定する。段階４５５において一連の中間持続時間メッセージの利用がイネーブルされている場合には、本方法は、段階４６０において、中間遅延モードの実現に際して一連の中間持続時間メッセージを利用する。
【００３８】
段階４６０に引き続いて、あるいは、段階４５５において一連の中間持続時間メッセージの利用がイネーブルされていない場合には、本方法は段階４６５へ進み、ＡＳＲ２４０入力チャネル利用度が（通話の終了に伴って）所定の第五の閾値未満に低下したかあるいは低下しているか否かを決定する。望ましい実施例においては、望ましい実施例においては、所定の第五閾値は、低遅延のモードへ移行する前にヒステリシス特性を実現する目的で、前記所定の第二閾値と第三閾値との間のレベルにセットされる。段階４６５におけるＡＳＲ２４０入力チャネル利用度が所定の第五閾値未満に低下した（あるいは低下している）場合には、本方法は段階４８０へ進み、本方法が低遅延モードへ進むべきか否かを決定する。
【００３９】
段階４６５におけるＡＳＲ２４０入力チャネル利用度が所定の第五閾値未満に低下していない（すなわちより大きい）場合には、本方法はＡＳＲ２４０入力チャネル利用度が（通話が着信されたために）所定の第一閾値より大きい状態に増加したか否かを決定する（段階４７０）。段階４７０においてＡＳＲ２４０入力チャネル利用度が所定の第一閾値より大きい状態に増加した場合には、本方法は高遅延モードに移行して段階４１０に戻る。段階４６５におけるＡＳＲ２４０入力チャネル利用度が所定の第五閾値未満に低下しておらず（すなわち第五閾値より大きく）、かつ、所定の第一閾値よりも大きくない（段階４７０）場合には、本方法は中間遅延モードを維持し（段階４７５）、段階４６５へ戻ってＡＳＲ２４０入力チャネル利用度のモニターを継続する。
【００４０】
段階４４０あるいは４６５に引き続いて、段階４８０におけるＡＳＲ２４０入力チャネル利用度が所定の第三（低レベル）閾値よりも大きい（しかしながら、段階４４０における所定の第二閾値よりは大きくない）場合には、本方法は低遅延モードを実現し、段階４８５へ進む。段階４８５では、本方法は、第一遅延タイプ（無音期間）が低遅延モードに対してイネーブルされているか否か、すなわち、無音期間増大の利用が医ネール部されているか否かを決定し、その場合には、段階４９０において、低遅延モードの実現に際して対応する（低すなわち最低）持続時間の無音期間を利用する。段階４９０に引き続いて、あるいは、段階４８５において無音期間増大の利用がイネーブルされていない場合には、本方法は段階４９５へ進み、低遅延モードに対して第二遅延タイプ（メッセージ持続時間）がイネーブルされているか否か、すなわち、一連の低持続時間メッセージの利用がイネーブルされているか否かを決定する。段階４９５において、一連の低持続時間メッセージの利用がイネーブルされている場合には、本方法は、段階５００において、低遅延モードの実現に際して対応する一連の（低）持続時間メッセージを利用する。
【００４１】
段階５００に引き続いて、あるいは、段階４９５において一連の低持続時間メッセージの利用がイネーブルされていない場合には、本方法は段階５０５へ進み、ＡＳＲ２４０入力チャネル利用度が（通話の終了に伴って）所定の第六閾値以下に低下したあるいは低下しているか否かを決定する。望ましい実施例においては、所定の第六閾値は、無遅延モードへの移行の前にヒステリシス特性を実現する目的で、所定の第三閾値よりも低いレベルに設定される。段階５０５において、ＡＳＲ２４０入力チャネル利用度が所定の第六閾値未満に低下した（すなわちより低い）場合には、本方法は段階５２５へ進み、無遅延モードにはいる。
【００４２】
段階５０５において、ＡＳＲ２４０入力チャネル利用度が所定の第六閾値未満に低下していない（すなわち、より低くない）場合には、本方法は、ＡＳＲ２４０入力チャネル利用度が（着信通話に伴って）所定の第一閾値より大きい状態に増加したか否かを決定する（段階５１０）。段階５１０において、ＡＳＲ２４０入力チャネル利用度が所定の第一閾値よりも大きい状態に増加した場合には、本方法は高遅延モードに移行し、段階４１０へ進む。段階５０５及び５１０において、ＡＳＲ２４０入力チャネル利用度が所定の第六閾値未満に低下しておらず（すなわち、第六閾値よりも大きく）、かつ、所定の第一閾値を越えるほどには増大していない場合には、本方法は、さらに、ＡＳＲ２４０入力チャネル利用度が所定の第二閾値よりも大きい状態まで増大しているか否かを決定する（段階５１５）。段階５１５においてＡＳＲ２４０入力チャネル利用度が所定の第二閾値よりも大きい状態まで増大している場合には、本方法は中間遅延モードに移行し、段階４４５に進む。ＡＳＲ２４０入力チャネル利用度が所定の第六閾値未満に低下しておらず（すなわち、より大きく）（段階５０５）、かつ、所定の第一閾値あるいは第二閾値を越えるほどには増大していない（段階５１０及び５１５）場合には、本方法は低遅延モードに留まり（段階５２０）、段階５０５へ戻ってＡＳＲ２４０入力チャネル利用度のモニターを継続する。
【００４３】
図４は、本発明に従って自動音声認識通話者入力レートを実現する第三の実施例を示す流れ図である。前述されているように、この実施例の遅延モードは、各通話が着信する際に通話毎に実装される。プロセスとして連続的に実行されている場合と異なり、この第三の方法は、段階６００で、ネットワークインターフェース１６０による通話の着信から開始される。その後、本方法は、段階６０５において、ＡＳＲ２４０入力チャネルの現在の利用度を決定する。ＡＳＲ２４０入力チャネル利用度が第一閾値より高い場合には（段階６１０）、遅延モードがセットされる（段階６１５）。次いで、本方法は、メッセージ出力に係るメッセージ持続時間及び／あるいは無音期間持続時間の決定など、着信通話に関する遅延パラメータを決定し（段階６２０）、通話に係るその他の処理を継続する（段階６４０）。
【００４４】
段階６１０におけるＡＳＲ２４０入力チャネル利用度が第一閾値より大きくない場合には、無遅延モードへ戻る前にヒステリシス特性を実現する目的で、本方法はＡＳＲ２４０入力チャネル利用度が第二閾値よりも高いか否かを決定する（段階６２５）。段階６２５において、ＡＳＲ２４０入力チャネル利用度が第二閾値よりも高い場合には、本方法は遅延モードが設定されているか否か、すなわち、遅延モードが以前の通話に関して設定されていた（利用度が以前は第一閾値よりも高かったことを意味する）か否かを決定する（段階６３０）。遅延モードが設定されていた場合には（段階６３０）、本方法は段階６２０へ進み、前述されているように、当該着信通話に係る遅延パラメータを決定する。遅延モードが設定されていなかった場合には（段階６３０）、以前の全ての遅延モードがクリアされていること（あるいは、全く設定されていなかったこと）を意味しており、本方法は段階６４０へ進んで、通話に係る他の処理を継続する。段階６２５において、ＡＳＲ２４０入力チャネル利用度が第二閾値を越えない場合には、本方法は遅延モードをクリア、すなわち、以前に設定されていたあらゆる遅延モードをリセットする（段階６３５）。段階６３５に引き続いて、本方法は、通話に係る他の処理を継続する。
【００４５】
以上に記載されたように、本発明の望ましい実施例は、自動音声認識を有するインタラクティブ通信システム向けの通話者入力レート制御を実現する。ここで、当該インタラクティブ通信システムは複数個の入力チャネル及び複数個の出力チャネルを有し、複数個のＡＳＲ入力チャネルを有する自動音声認識コンポーネントを有している。本発明に従った方法は、まず、複数個のＡＳＲ入力チャネルの利用度を決定する段階、次いで、複数個のＡＳＲ入力チャネルの利用度が第一の所定の閾値より大きい場合に、複数個の出力チャネルのうちの単一あるいは複数の出力チャネルに係るメッセージ出力に関連する遅延モードを実現する段階、を有している。
【００４６】
追加的なコンセントレータ機能は、モニターされたエネルギーレベルを生成する目的で（複数個の入力チャネルのうちの）入力チャネルのエネルギーレベルをモニターする段階；バッファされた情報を形成する目的で、以前の時間期間における入力チャネルから受信された全ての（エコー打ち消し済みの）入力をメモリバッファにストアする段階；及び、モニターされたエネルギーレベルが所定のエネルギーレベルよりも大きい場合に、バッファされた情報を複数個のＡＳＲ入力チャネルのうちのＡＳＲ入力チャネルに送出し、入力チャネルをＡＳＲ入力チャネルに接続する段階、を有している。
【００４７】
種々の関連する遅延モードは、出力チャネル上のメッセージ出力に関して、複数のメッセージ持続時間のうちからあるメッセージ持続時間を、及び、複数個の無音期間持続時間のうちからある無音期間持続時間を、それぞれ独立に、あるいは個別にもしくは組み合わせて選択することによって決定される。望ましい実施例においては、種々の関連する遅延モードは、複数個のＡＳＲ入力チャネルの利用度に比例し、あるいは、複数個のＡＳＲ入力チャネルの利用度の範囲に対応する。
【００４８】
本発明の数々の利点は以上の議論より明らかである。第一に、利用者は、全てのＡＳＲ入力チャネルが他の利用者へのサービス提供に関してビジー状態である場合においても、保留されたり切断されたりすることなく、実際にインタラクティブシステムによってサービスを提供される。第二に、本発明の種々の実施例は、与えられたすなわち固定された個数のＡＳＲ入力チャネルを増加させることを要求せずにＡＳＲシステム容量を増大させ、既存のＡＳＲ入力チャネルのより効率的な利用を実現する。加えて、ＡＳＲ入力チャネルをより効率的に利用することによって、実際の通話者待機時間が減少し、より長い持続時間を有するプロンプトあるいはメッセージによって通話者にサービスを提供し続けることによって、見かけの待機時間も減少する。最後に、本発明によって実現された容量の増大はユーザに対して透過的であり、ユーザフレンドリーであり、混雑すなわち過負荷状況においても利用者には実効的に気付かれず、既存の自動音声認識システムにおいてコスト効率良く実装されることが可能である。
【００４９】
以上の説明は、本発明の一実施例に関するもので，この技術分野の当業者であれば、本発明の種々の変形例が考え得るが、それらはいずれも本発明の技術的範囲に包含される。
【００５０】
【発明の効果】
以上述べたごとく、本発明によれば、自動音声認識システムの容量を増大させる通話者入力レート制御方法、通話者入力レート制御システム、及び、通話者入力レート制御装置が提供される。
【００５１】
特許請求の範囲に発明の構成要件の後の括弧内の符号が記載されている場合は、構成要件と実施例と対応づけて発明を容易に理解させる為であり、特許請求の範囲の解釈に用いるべきのものではない。
【図面の簡単な説明】
【図１】本発明に従って自動音声認識通話者入力レート制御を実現するシステム及び装置を示すブロック図。
【図２】本発明に従って自動音声認識通話者入力レート制御を実現する第一の方法を例示する流れ図。
【図３】本発明に従って自動音声認識通話者入力レート制御を実現する第二の方法を例示する流れ図。
【図４】本発明に従って自動音声認識通話者入力レート制御を実現する第三の方法を例示する流れ図。
【符号の説明】
１００自動音声認識システム
１１０ネットワーク
１１５交換センター
１２０ルータ
１２５サーバ
１３０モバイル局
１３５基地局
１４０電話機
１４５コンピュータ
１６０ネットワークインターフェース
１６５バス
２００通話者入力レート制御装置
２１０プロセッサ
２１５バス
２２０メモリ
２２５バス
２３０オブザーバモジュール
２３５バス
２４０自動音声認識システム
２４５通話制御モジュール
２５０出力モジュール
２５５メッセージ選択モジュール
２６０メッセージメモリ
３００遅延モード処理
３０５ＡＳＲ入力チャネルの利用度を決定
３１０ＡＳＲ入力チャネルの利用度が所定の第一閾値より高いか？
３１５ＡＳＲ入力チャネルの利用度に比例した関連する遅延モードを実現
３２０ＡＳＲ入力チャネルの利用度を決定
３２５ＡＳＲ入力チャネルの利用度が所定の第二閾値より低いか？
３３０無遅延モードに戻る
４００遅延モード処理
４０５ＡＳＲ入力チャネルの利用度が第一（高）閾値より高いか？
４１０高レベル無音期間がイネーブルされているか？
４１５高レベル無音期間を利用
４２０高レベルメッセージ持続時間がイネーブルされているか？
４２５高レベルメッセージ持続時間を利用
４３０ＡＳＲ入力チャネルの利用度が第四閾値未満か？
４３５高遅延モードを維持
４４０ＡＳＲ入力チャネルの利用度が第二（中間）閾値より高いか？
４４５中間レベル無音期間がイネーブルされているか？
４５０中間レベル無音期間を利用
４５５中間レベルメッセージ持続時間がイネーブルされているか？
４６０中間レベルメッセージ持続時間を利用
４６５ＡＳＲ入力チャネルの利用度が第五閾値未満か？
４７０ＡＳＲ入力チャネルの利用度が第一閾値より高いか？
４７５中間遅延モードを維持
４８０ＡＳＲ入力チャネルの利用度が第三（低）閾値より高いか？
４８５低レベル無音期間がイネーブルされているか？
４９０低レベル無音期間を利用
４９５低レベルメッセージ持続時間がイネーブルされているか？
５００低レベルメッセージ持続時間を利用
５０５ＡＳＲ入力チャネルの利用度が第六閾値未満か？
５１０ＡＳＲ入力チャネルの利用度が第一閾値より高いか？
５１５ＡＳＲ入力チャネルの利用度が第二閾値より高いか？
５２０低遅延モードを維持
５２５無遅延モードを維持（あるいは無遅延モードに戻る）
６００開始：着信
６０５ＡＳＲ入力チャネルの現在の利用度を決定
６１０ＡＳＲ入力チャネルの利用度が第一閾値より高いか？
６１５遅延モードをセット
６２０着信通話に係る遅延パラメータを決定
６２５ＡＳＲ入力チャネルの利用度が第二閾値より高いか？
６３０遅延モードがセットされているか？
６３５遅延モードをクリア
６４０通話処理を継続

Claims

自動音声認識を有するインタラクティブ通信システムにおける通話者入力レート制御を提供する方法において、前記インタラクティブ通信システムが複数個の入力チャネル及び複数個の出力チャネルを有し、前記インタラクティブ通信システムが複数個の自動音声認識入力チャネルを有し、該方法が、
前記複数個の自動音声認識入力チャネルの現在の利用度を計算または計測するステップ、
前記複数個の自動音声認識入力チャネルの前記利用度が所定の第一閾値よりも大きい場合に、前記複数個の出力チャネルの出力チャネルに係るメッセージ出力に対して、メッセージの持続時間が増大するように前記複数個の自動音声認識入力チャネルの前記利用度が所定の第一閾値よりも大きい場合と関連する遅延モードを実現するステップ、
モニターされたエネルギーレベルを生成する目的で前記複数個の入力チャネルのうちの入力チャネルのエネルギーレベルをモニターするステップ、
以前の時間期間に亘る入力チャネルから着信されたエコーキャンセル済み入力全てよりなる複数個のサンプルをメモリバッファにストアするステップ、及び
前記モニターされたエネルギーレベルが所定のエネルギーレベルより大きい場合に、前記バッファされた情報を前記複数個の自動音声認識入力チャネルのうちの自動音声認識入力チャネルに送出し、前記入力チャネルを前記自動音声認識入力チャネルに接続するステップ
からなる方法。
自動音声認識を有するインタラクティブ通信システムにおける通話者入力レート制御を提供する方法において、前記インタラクティブ通信システムが複数個の入力チャネル及び複数個の出力チャネルを有し、前記インタラクティブ通信システムが複数個の自動音声認識入力チャネルを有し、該方法が、
前記複数個の自動音声認識入力チャネルの現在の利用度を計算または計測するステップ、及び
前記複数個の自動音声認識入力チャネルの前記利用度が所定の第一閾値よりも大きい場合に、前記複数個の出力チャネルの出力チャネルに係るメッセージ出力に対して、メッセージの持続時間が増大するように前記複数個の自動音声認識入力チャネルの前記利用度が所定の第一閾値よりも大きい場合と関連する遅延モードを実現するステップであって、前記複数個の自動音声認識入力チャネルの前記利用度が所定の第一閾値よりも大きい場合と関連する遅延モードが、前記出力チャネルに係る前記メッセージ出力に対して、複数個のメッセージ持続時間のうちからあるメッセージ持続時間を、及び、複数個の無音期間持続時間のうちからある無音期間持続時間を、個々にあるいは組み合わせで独立に選択することによって決定される、ステップ
からなる方法。
自動音声認識を有するインタラクティブ通信システムにおける通話者入力レート制御を提供する方法において、前記インタラクティブ通信システムが複数個の入力チャネル及び複数個の出力チャネルを有し、前記インタラクティブ通信システムが複数個の自動音声認識入力チャネルを有し、該方法が、
前記複数個の自動音声認識入力チャネルの現在の利用度を計算または計測するステップ、及び
前記複数個の自動音声認識入力チャネルの前記利用度が所定の第一閾値よりも大きい場合に、前記複数個の出力チャネルの出力チャネルに係るメッセージ出力に対して、メッセージの持続時間が増大するように前記複数個の自動音声認識入力チャネルの前記利用度が所定の第一閾値よりも大きい場合と関連する遅延モードを実現するステップであって、前記複数個の自動音声認識入力チャネルの前記利用度が所定の第一閾値よりも大きい場合と関連する遅延モードが複数個の関連する遅延モードから選択され、前記出力チャネルに係る出力に対する前記複数個の関連する遅延モードが対応する複数個の一連のメッセージを有し、ここで、前記対応する複数個の一連のメッセージは第一の一連のメッセージ及び第二の一連のメッセージを含んでおり、前記第一の一連のメッセージが前記第二の一連のメッセージと比較してより大きい漸増的遅延を有している、すなわち、前記第一の一連のメッセージのうちの各々のメッセージが前記第二の一連のメッセージのうちの各々対応するものよりも長い持続時間を有している、ステップ
からなる方法。
自動音声認識向けの通話者入力レート制御を有するインタラクティブ通信システムにおいて、該システムが、
複数個の入力チャネル及び複数個の出力チャネルを有するネットワークインターフェース、
前記複数個の出力チャネルに係るメッセージ出力を行なう出力モジュール、
複数個の自動音声認識入力チャネルを有する自動音声認識モジュール、及び
前記複数個の入力チャネル、前記出力モジュール及び前記自動音声認識入力チャネルに接続された通話者入力レート制御モジュールであって、前記複数個の自動音声認識入力チャネルの現在の利用度を計算または計測する命令を含み、前記複数個の自動音声認識入力チャネルの前記利用度が所定の第一閾値より大きい場合に、前記出力モジュールに、前記複数個の出力チャネルのうちの出力チャネルに係るメッセージ出力にメッセージの持続時間が増大するように前記複数個の自動音声認識入力チャネルの前記利用度が所定の第一閾値よりも大きい場合と関連する遅延モードを実現させる命令を含む、通話者入力レート制御モジュール
からなるシステム。
請求項４記載のシステムにおいて、前記通話者入力レート制御モジュールが、さらに、
モニターされたエネルギーレベルを生成する目的で前記複数個の入力チャネルのうちの入力チャネルのエネルギーレベルをモニターさせる命令、
以前の時間期間に亘る入力チャネルから着信されたエコーキャンセル済み入力全てよりなる複数個のサンプルをメモリバッファにストアさせる命令、
前記モニターされたエネルギーレベルが所定のエネルギーレベルより大きい場合に、前記バッファされた情報を前記複数個の自動音声認識入力チャネルのうちの自動音声認識入力チャネルに送出し、前記入力チャネルを前記自動音声認識入力チャネルに接続させる命令
を含むシステム。
請求項４記載のシステムにおいて、前記通話者入力レート制御モジュールが、さらに、前記出力チャネルに係る前記メッセージ出力に対して、複数個のメッセージ持続時間のうちからあるメッセージ持続時間を、及び、複数個の無音期間持続時間のうちからある無音期間持続時間を、個々にあるいは組み合わせで独立に選択することによって前記関連する遅延モードを決定させる命令を含むシステム。
請求項４記載のシステムにおいて、前記通話者入力レート制御モジュールが、さらに、前記出力チャネルに係る前記メッセージ出力に対する前記関連する遅延モードにおいて無音期間の利用を含ませるように前記出力モジュールに指示する命令を含むシステム。
請求項４記載のシステムにおいて、前記通話者入力レート制御モジュールが、さらに、前記複数個の自動音声認識入力チャネルの前記利用度が所定の第二閾値未満である場合に、前記出力チャネルに係る前記メッセージ出力に関して無遅延モードを実現させるように前記出力モジュールに指示する命令を含むシステム。
自動音声認識を有するインタラクティブ通信システムにおける通話者入力レート制御を行う装置において、該インタラクティブ通信システムが複数個の入力チャネル及び複数個の出力チャネルを有し、複数個の自動音声認識入力チャネルを有する自動音声認識コンポーネントを含み、及び前記複数個の出力チャネル上のメッセージ出力に係る出力モジュールを含み、前記装置が前記入力チャネルと、前記出力モジュールと、及び前記自動音声認識入力チャネルと接続可能であり、前記装置が、
前記複数個の入力チャネルに接続可能なオブザーバモジュール、
前記オブザーバモジュールに接続されており前記複数個の自動音声認識入力チャネルに接続可能なメモリ、及び
前記オブザーバモジュール及び前記メモリに接続されたプロセッサであって、該プロセッサは、前記出力モジュール及び前記複数個の自動音声認識入力チャネルに対してさらに接続可能であり、当該プロセッサは前記複数個の自動音声認識入力チャネルの現在の利用度を計算または計測する命令を有しており、前記複数個の自動音声認識入力チャネルの前記利用度が所定の第一閾値より大きい場合に、前記出力モジュールに、前記複数個の出力チャネルのうちの出力チャネルに係るメッセージ出力に、メッセージの持続時間が増大するように前記複数個の自動音声認識入力チャネルの前記利用度が所定の第一閾値よりも大きい場合と関連する遅延モードを実現させる命令を有している、プロセッサ
からなる装置。
自動音声認識を有するインタラクティブ通信システムにおける通話者入力レート制御を行う装置において、前記インタラクティブ通信システムが、複数個の入力チャネル及び複数個の出力チャネルを有し、複数個の自動音声認識入力チャネルを有する自動音声認識コンポーネントを含み、前記複数個の出力チャネル上のメッセージ出力に係る出力モジュールを含み、前記装置が、
前記複数個の入力チャネルに接続可能なオブザーバモジュールであって、モニターされたエネルギーレベルを生成する目的で前記複数個の入力チャネルのうちの入力チャネルのエコー打ち消しを実現してエネルギーレベルをモニターし、前記モニターされたエネルギーレベルが所定のエネルギーレベルより大きい場合に前記入力チャネルを前記自動音声認識入力チャネルのうちの自動音声認識入力チャネルに接続するように機能するオブザーバモジュール、
前記オブザーバモジュールに接続されており前記複数個の自動音声認識入力チャネルに接続可能なメモリであって、以前の時間期間に亘る入力チャネルから着信されたエコーキャンセル済み入力全てよりなる複数個のサンプルをストアし、かつ、前記バッファされた情報を前記自動音声認識入力チャネルに送出するように機能するメモリ、及び
前記オブザーバモジュール及び前記メモリに接続されたプロセッサであって、前記出力モジュール及び前記複数個の自動音声認識入力チャネルに対してさらに接続可能であり、前記複数個の自動音声認識入力チャネルの現在の利用度を計算または計測する命令を含み、前記複数個の自動音声認識入力チャネルの前記利用度が所定の第一閾値より大きい場合に、前記出力モジュールに、前記複数個の出力チャネルのうちの出力チャネルに係る複数個のメッセージ出力に、メッセージの持続時間が増大するように前記複数個の自動音声認識入力チャネルの前記利用度が所定の第一閾値よりも大きい場合と関連する遅延モードを実現させる命令を含み、さらに、前記複数個の自動音声認識入力チャネルの前記利用度が所定の第二閾値より低い場合に、前記出力モジュールに、前記複数個の出力チャネルのうちの出力チャネルに係る前記複数個のメッセージ出力に無遅延モードを実現させる命令を含むプロセッサ
からなる装置。