JP5051945B2 - 通話者入力レート制御方法、通話者入力レート制御システム、及び通話者入力レート制御装置 - Google Patents

通話者入力レート制御方法、通話者入力レート制御システム、及び通話者入力レート制御装置 Download PDF

Info

Publication number
JP5051945B2
JP5051945B2 JP2001092258A JP2001092258A JP5051945B2 JP 5051945 B2 JP5051945 B2 JP 5051945B2 JP 2001092258 A JP2001092258 A JP 2001092258A JP 2001092258 A JP2001092258 A JP 2001092258A JP 5051945 B2 JP5051945 B2 JP 5051945B2
Authority
JP
Japan
Prior art keywords
speech recognition
automatic speech
output
channels
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001092258A
Other languages
English (en)
Other versions
JP2001320490A5 (ja
JP2001320490A (ja
Inventor
アラン ジョンソン マーク
Original Assignee
アルカテル−ルーセント ユーエスエー インコーポレーテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アルカテル−ルーセント ユーエスエー インコーポレーテッド filed Critical アルカテル−ルーセント ユーエスエー インコーポレーテッド
Publication of JP2001320490A publication Critical patent/JP2001320490A/ja
Publication of JP2001320490A5 publication Critical patent/JP2001320490A5/ja
Application granted granted Critical
Publication of JP5051945B2 publication Critical patent/JP5051945B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition

Description

【0001】
【発明の属する技術分野】
本発明は自動音声認識システムに関し、特に、インタラクティブ情報通信システムにおいて用いられる自動音声認識システムに対する通話者の入力レートを制御する装置、方法及びシステムに関する。
【0002】
【従来の技術】
自動音声認識システムは、種々のインタラクティブ通信及びその他のサービスにおいて幅広く用いられるようになってきている。例えば、自動音声認識システムは、航空会社フライト情報システム、音声ダイアル通信システム、及び(音声合成を利用する)電子メール読み出しなどのインタラクティブシステムにおける可聴音プロンプトに対する音声応答を認識する目的で用いられている。
【0003】
しかしながら、自動音声認識システムは、通常32から64という、限られた固定数の入力チャネルしか有していない。従来技術に係る音声認識システムは、これら入力チャネルを通話者(あるいは他のユーザ)当たりに割り当てる。結果として、全ての入力チャネルが使用中であると、その後の通話者は、通常、入力チャネルが利用可能になるまでの間、保留される。ある種のシステムは、保留にしている通話者宛に音楽あるいはアナウンスを提供し、別の種類のシステムは、通話者に、通話者が待ち行列におかれていることに係る情報を提供する。より混雑が激しくなった場合には、利用者は、別の時刻に再度電話をかけるように通知され、その通話が切断されることになる。
【0004】
【発明が解決しようとする課題】
残念ながら、過負荷状況に対するこの種の通話保留あるいは通話切断は、利用者に、通常不満あるいはいらだちを起こさせる。通話者は、通常、待ち行列におかれることを好まず、さらには憤慨する可能性もある。従って、サービスプロバイダは、利用者のサービス要求を、タイムリーに、ユーザフレンドリーに、効率的に、かつ、対費用効果がよくなるように充足させることを望んでいる。
【0005】
従って、通話者入力チャネルの固定数を増加させることなく自動音声認識システムの容量を増大させる装置、方法及びシステムを実現する要求が存在する。このようにして増大させられた容量は、ユーザに対して透過的で、ユーザフレンドリーで、かつ、混雑すなわち過負荷状況の場合に利用者に対して実質的に認識不能であるべきである。このようにして増大させられた容量は、既存の自動音声認識システムにおいて、通話者入力チャネルの固定数に拘わらずに容量を増大し、対費用効果が望ましいものであるように実装されることが可能であるべきである。
【0006】
【課題を解決するための手段】
本発明の種々の実施例は、自動音声認識(ASR)システムの容量を、主として二つのタイプの機能、すなわち、コンセントレータ機能及び遅延機能、を実行することによって増大させる。本発明に係るコンセントレータ機能は、アクティブな通話者入力チャネルのみを音声認識目的のASR入力チャネルに切り替えること(すなわち、通話者がサービスプロバイダのメッセージを聞いているような出力(再生)モードのみに関してアクティブであるチャネルに対してASR機能を提供しないあるいは予約しないこと)によって、より多くの個数の通話者入出力(I/O)チャネルが用いられることを可能にする。遅延機能は、起こりうる過負荷状況に係るものであり、出力(再生)モードの持続時間を増加させるように実装されており、そのことによって、通話者が聞いているだけの時間を増加させ、従って、入力ASRチャネルが他の通話に係る音声入力を認識する(及び、望むらくは、より多くの通話量を処理する)目的で用いられる時間をより多く実現する。遅延機能は、入力プロンプトとして通話者に対して再生されるメッセージの持続時間を増大させること、及び、通話者に対して再生される種々のメッセージの開始部あるいはその途中に無音期間を挿入すること、のいずれかあるいはその双方の遅延タイプを用いて実装されることが望ましい。
【0007】
自動音声認識に係る本発明に従った通話者入力レート制御を有する望ましいインタラクティブ通信システムは、第一に、入力チャネル及び出力チャネルを有するネットワークインターフェース;第二に、出力チャネル上のメッセージ出力に係る出力モジュール;第三に、ASR入力チャネルを有する自動音声認識モジュール;及び、入力チャネル、出力モジュール及びASR入力チャネルに対して接続された通話者入力レート制御モジュールを有している。通話者入力レート制御モジュールは、ASR入力チャネルの利用レベル(利用度)を決定するインストラクションを有しており、ASR入力チャネルの利用度が所定の第一閾値よりも大きい場合には、出力モジュールに、出力チャネル上のメッセージ出力に対して関連する遅延モードを実現するように指示する。
【0008】
通話者入力レート制御モジュールは、入力チャネルのエネルギーレベルをモニターし、直前の時間期間において入力チャネルから受信した入力の全てをメモリバッファにストアしてバッファ済み情報を構成することによって、コンセントレータ機能を実現する。与えられた入力チャネルのモニターされたエネルギーレベルが所定のエネルギーレベルよりも大きい場合には、通話者入力レート制御モジュールはバッファ済み情報をASR入力チャネルに送信し、音声認識目的でその入力チャネルをASR入力チャネルに接続する。
【0009】
通話者入力レート制御モジュールは、複数個のメッセージ持続期間からあるメッセージ持続期間を選択すること、及び、複数個の無音持続期間からある無音持続期間を選択すること、を個々に行なうかあるいは組み合わせて行なうことによって、関連する遅延モードを決定する。関連する遅延モードは、ASR入力チャネルの利用度に比例するか、あるいは、ASR入力チャネルの利用度の範囲あるいは増分に対応する。
【0010】
本発明に係る種々の利点には、全てのASR入力チャネルが他の通話者に対してサービスを提供するために占有されている場合においても、通話者を保留にしたり通話を切断することなく、インタラクティブシステムによって通話者に対して実際にサービスが提供されることが含まれる。第二に、本発明の種々の実施例は、与えられたあるいは固定された個数のASR入力チャネルを増大を要求することなくASRシステムの容量を増大させ、既存のASR入力チャネルをより効率的に利用させる。加えて、ASR入力チャネルをより効率的にりようすることによって、実際の通話者待機時間が減少し、より長い持続時間を有するプロンプトあるいはメッセージを介して通話者にサービスを提供し続けることによって、見かけの待機時間も減少する。最後に、本発明によって実現された容量の増大はユーザに対して透過的であり、ユーザフレンドリーであり、混雑すなわち過負荷状態における利用者にとっては実効的に認識不能であり、及び、既存の自動音声認識システムにおいて対費用効果を充分に有するように実装されることが可能である。
【0011】
【発明の実施の形態】
本発明の実施例には種々の変形例が考えられるが、以下、本明細書においては、特定の実施例に関連して詳細に図示及び記述される。本明細書における技術開示は本発明の原理を例示するものであり、本発明を例示された特定の実施例に限定するものではないことに留意されたい。
【0012】
前述されているように、自動音声認識(“ASR”)システムの容量を増大させることに対する要求が依然として存在する。本発明に従って、与えられたあるいは固定された数のASR入力チャネルの対応する増加を要求することなく、この種のASR容量を増大させる装置、方法及びシステムが以下に例示される。加えて、本発明に従って実現された容量増大は、ユーザに対して透過的であり、ユーザフレンドリーであり、混雑すなわち過負荷状態における利用者にとっては実効的に認識不能である。本発明の種々の実施例は、ASRシステムの実際の待機時間及び見かけの待機時間(及び/あるいは保留時間)の双方を減少させ、ユーザ及びサービスプロバイダの満足感を増大させる。本発明によって実現されたシステム容量増大は、既存の自動音声認識システムにおいて高い対費用効果で実装されることが可能であり、与えられた、既存の個数のASR通話者入力チャネルをより効率的に利用することが可能になり、及び、ASR通話者入力チャネルの個数及び対応する資本支出の増加を必要とすることなく、システム容量増大を実現する。
【0013】
本発明は、自動音声認識を利用するインタラクティブ通信システムに係る種々の経験的な観察結果を活用する。より詳細に述べれば、この種のインタラクティブシステムにおいては、通話者が、サービスプロバイダからのプロンプト、メッセージあるいは他の情報を聞いている種々の時間期間が存在し、これらの時間期間の間は全ての対応するASR入力チャネルがアイドル状態にあって、現時点でのプロンプトあるいはメッセージに対する通話者からの応答を待機している。本発明は、このような、従来技術においてはASRのアイドル期間であったものを、以下に議論されるコンセントレータ機能を用いて、他の通話者に対する音声認識サービスを実現する目的で利用する。加えて、混雑すなわち過負荷になっている時間期間においては、本発明は、以下に議論される遅延機能を用いて、通話者に対して再生されるメッセージ(プロンプト)の持続時間を修正して増大させ、このことによって、通話者が聞いているだけの時間を透過的に増大させる。結果として、本発明の種々の実施例は、通話者に対するサービス供給を継続しつつ、同時に、ASR入力チャネルに係るより多くの時間が他の通話に対して用いられることを必要に応じて可能にし、この種の制限されたASR入力チャネル数に起因する過負荷すなわち“ボトルネック”状況を減少させる。
【0014】
本発明の種々の実施例においては、プロンプトあるいは他のメッセージの持続時間が、単一あるいは複数個のメッセージの持続時間をより長くすること及びメッセージ間の無音時間期間を増大させることの双方によって、通話者にとって知覚不能であるように、増加させられる。この時間の間、ASR入力チャネルは、例えば、対応するプロンプトあるいは他のメッセージに対して音声応答している通話者のような他のアクティブ通話に係る音声認識に関して用いられる。あらゆる持続時間のプロンプトの後に、利用者が発話することによって応答する場合には、利用可能なASR入力チャネルがその応答の認識に対して利用され、その応答の後には、ASR入力チャネルが再び他の通話者の応答認識に関して利用可能になる。
【0015】
それゆえ、本発明に従って、利用者は、全てのASR入力チャネルが他の利用者に対してサービスを提供しているためにビジー状態である場合においても、保留されたり通話を切断されたりすることなく、実際にインタラクティブシステムによってサービスを提供されることになる。結果として、本発明の種々の実施例は、既存のASR入力チャネルをより効率的に利用すること及び“負荷時の上品な低下”として当業者には既知の手法を実現することの双方によって、ASRシステム容量を増大させる。加えて、ASR入力チャネルをより効率的に用いることによって、通話者にとっての実際の待機(あるいは保留)時間が減少し、より長い持続時間を有するプロンプトあるいはメッセージを介して通話者にサービスを提供し続けることによって、見かけの待機時間も減少する。
【0016】
図1は、本発明の実施例に従って自動音声認識通話者入力レート制御を実現するシステム100及び装置200を示すブロック図である。図1に示されているように、インタラクティブシステム100は、ネットワークインターフェース160、出力(すなわち再生)モジュール250、通話者入力レート制御モジュールあるいは装置200、自動音声認識(ASR)システム(コンポーネントあるいはモジュール)240、及び、オプションとしての通話制御モジュール245を有している。通話制御モジュール245は、例えば航空会社フライト情報、株価市況サービス、電子メール読み上げ、あるいは音声ダイアルなどの選択されたサービスに対応して、(例えば航空機の到着時刻あるいは株価市況などの)選択された情報を供給し、電子メールメッセージを読み上げ、あるいは、(電話のダイアリングなどの)他の選択されたサービスを実行する。ネットワークインターフェース160は、出力モジュール250から通話者に対するメッセージあるいはプロンプトの再生する出力や、通話者の音声を通話者入力レート制御装置200及びASR240へ供給する入力として機能する、システム100の通話者入出力(“I/O”)を実現する。
【0017】
ネットワークインターフェース160は、公衆交換電話網(“PSTN”)、総合デジタルサービス網(“ISDN”)あるいは他のデジタルネットワーク、及び/あるいはインターネットなどのパケットベースネットワークなど、単一あるいは複数個のネットワーク110に接続されている。ネットワーク110は、(有線あるいは無線の)交換センター115、ルータ120、及びサーバ125からなる種々のシステムに接続されており、これらは、電話機140(あるいは他の利用者邸内装置)、(基地局135経由の)モバイルユニット130(例えばセルラ電話機あるいはPCS電話機)、及びコンピュータ145(あるいは他のネットワークアクセスデバイス)などを介して、通話者と他の利用者との間の通信を実現する。これらのあらゆる種々の通信メディアを介して、通話者あるいは他の利用者は、航空会社フライト情報、音声ダイアリング、あるいは電子メール読み出しなどのインタラクティブASRサービスを利用するためにシステム100にアクセスする。
【0018】
図1において、ASR240は、種々のプロンプトに対する通話者の応答の認識などの音声認識を実行する。ASR240は、通常、図1のバス215部分に示されているように、固定数、例えば“S”個の入力チャネルを有している。本発明に従って、システム100により大きな容量を実現する目的で、ネットワークインターフェース160がASR240に非悪してより多くの個数のI/Oチャネル、例えば“R“個のI/Oチャネルを有している(各I/O対を1チャネルと数え、この際にR>Sである(図1のバス165に示されているように、R個の入力チャネルが装置200に対してバス225を介して接続されており、R個の出力チャネルがバス235を介して出力モジュール250に接続されている))。
【0019】
通話制御モジュール245は、選択されたサービスに応答して、ASR240から受信された入力に従って種々のサービスを実現する。例えば、ASR240からの認識された音声に依存して、通話制御モジュール245は、(出力モジュール250の)メッセージ選択モジュール255に、航空会社のフライト番号を要求するプロンプトを提供させ、その後の音声認識に従って、通話制御モジュール245が特定のフライトに係る情報に関してデータベース(図示せず)をアクセスして、出力モジュール250に対応するフライトの到着あるいは出発時刻に係る出力を(ネットワークインターフェース160)を介して出力させる。
【0020】
本発明に従って、通話者入力レート制御装置200は、オブザーバモジュール230、プロセッサ210、及びメモリ220を有することが望ましい。オブザーバモジュール230は、エコーキャンセラ及びエネルギーデテクタを有している。オブザーバモジュール230のエコーキャンセラ部分は、ネットワークインターフェース160の入力において検出された発信メッセージからあらゆるエコーを除去する。オブザーバモジュール230のエネルギーデテクタ部分は、ネットワークインターフェース160の複数個の入力チャネル225の各々におけるエネルギー(すなわち、電力と等価である)を検出する目的で用いられ、通話者が話し始めたこと、すなわち、対応する入力チャネルがASR240による音声認識によって処理されるべきであることを示す。本発明の望ましい実施例においては、オブザーバモジュール230は、−40dBmの背景雑音レベルに対しては、およそ−30dBmでのエネルギー検出を実行する。メモリ220は、例えば種々のタイプのランダムアクセスメモリ(RAM)、DRAM、SRAMあるいはMRAMなどのデータストレージ集積回路(“IC”)、あるいは他の回路あるいは装置であって、(少なくともその一部が)サーキュラーバッファとして実装されていることが望ましい。本発明の望ましい実施例においては、メモリ220は、全ての入力チャネル225からの所定の量の(音声あるいは無音の)最新のサンプルをストアする。通話者からの音声の損失を防止する目的で、オブザーバモジュール230があらゆる与えられた入力チャネル225上でエネルギー(入力音声)を検出した際には、その入力チャネルに対応するストアされた(音声)サンプルが、当該チャネル上の現在の全ての入力音声に加えて、ASR240に対して認識目的で送出される。結果として、(検出されたエネルギーレベルによって表わされているように)入力チャネルがアクティブの場合にのみネットワークインターフェース160からの入力チャネルをASR240に対して接続する(すなわち、ネットワークインターフェース160からの入力チャネルをオブザーバ230及びメモリ220を介してASR240に接続する)ことによって、装置200のオブザーバモジュール230及びメモリ220は(プロセッサ210と共に)コンセントレータ機能を有することになり、ASR240の入力チャネル数(S)と比較してより大きな個数(R)の入力チャネル225が用いられることが可能になり、よって、(ASR240の入力チャネル数を増加させることなく)システム100の容量を増大することが可能になる。
【0021】
図1では、装置200のプロセッサ210は、単一の集積回路(“IC”)を含むか、あるいは、例えばマイクロプロセッサ、デジタルシグナルプロセッサ(“DSP”)、アプリケーションスペシフィック集積回路(“ASIC”)、フィールドプログラマブルゲートアレイ(“FPGA”)、関連するメモリ(例えばRAM、DRAM、SRAM、MRAM及びROM)、及び他のIC及びコンポーネントなどによって構成された複数個の集積回路及び他のコンポーネントを含んでいる。結果として、本明細書においては、プロセッサという術語は、関連するメモリ、例えばマイクロプロセッサメモリあるいは外部RAM、DRAM、SRAM、MRAM、ROM、EPROM、E2PROMなどと共に機能する単一のプロセッサ、あるいは、プロセッサ、マイクロプロセッサ、コントローラなどからなる配置、前述及び図2から図4に関連して以下に詳述される機能を実行する他のある種の集積回路群を等価的に意味していて含んでいることに留意されたい。前述及び図2から図4に関連して以下に詳述される本発明に係る方法論は、プログラムされ、プロセッサ210及びその関連するメモリ(及び/あるいはメモリ220)及び他の等価なコンポーネントに、プロセッサ210が動作している(すなわち、電源が投入されていて機能している)際に実行されるプログラムインストラクション(あるいは等価な配置もしくはプログラム)の組としてストアされる。(言い換えれば、プロセッサ210及びその関連するコンポーネント及び他の等価なコンポーネントが、全体としてあるいはその一部がFPGA及び/あるいはASICに実装されている場合には、FPGAあるいはASICが、本発明の方法論を実装するように設計されて配置あるいは配線されている。)本発明の望ましい実施例においては、プロセッサ210は、オブザーバモジュール230及びASR240の機能を実装していて実行する。
【0022】
前述されたコンセントレータ機能の促進及び増大に加えて、プロセッサ210は本発明に係る種々の遅延機能を実現する。例えば、ASR240の入力チャネルの利用度合に基づいて、プロセッサ210は、例えば無遅延、軽(低)遅延、中庸(中間)遅延、あるいは重(高)遅延といった種々の遅延モードを選択することが可能である。前述されているように、本発明は、(出力モジュール250を介して)通話者に再生されるプロンプトあるいは他のメッセージの持続時間の増大、及び、これらプロンプトあるいは他のメッセージ中の無音期間の持続時間の増大、という二つのタイプの遅延機能を利用する。これら二つのタイプの遅延機能は、互いに独立に実装されることが可能であり、また、個々にあるいは互いに組み合わせて実装することも可能である。以下に詳細に議論されるように、この種の遅延機能は連続的(図2)あるいは漸増的(図3)に実装されうる。加えて、このような遅延機能は、進行中の全ての通話に係る連続的に実行されるプロセスとして実装されることが可能であり、また、(通話毎に)受信した各通話に関して実装されることも可能である。
【0023】
本発明の望ましい実施例における、プロセッサ210による遅延実現の一つの形態は、出力モジュール250によって再生されるメッセージ(あるいはプロンプト)内の無音期間の持続時間の増大である。例えば、プロンプトの開始部における50から2000ミリ秒のオーダーの遅延(すなわち、開始部の無音期間)は、一般的には利用者に認識されない。種々の持続時間を有する他の無音期間も、メッセージあるいはプロンプト中に用いられる発話間に挿入可能である。本発明の望ましい実施例においては、この種の付加すなわち挿入される無音期間が、メッセージ/プロンプトの開始部に用いられ、さらに、ある程度(対応するメッセージあるいはプロンプトが、ぎこちなくあるいは人工的ではなく、受認可能であると認識され続ける程度)はメッセージ/プロンプト内で用いられる。
【0024】
本発明の望ましい実施例においては、利用者に対する透過性を最大にする目的で、選択されたサービスに関して通話者に対して供給される(プロンプトなどの)メッセージが、種々の相異なった持続時間を有する一連の(シリーズ)メッセージとして予め録音されている。これらは、出力モジュール250を介して、ネットワークインターフェース160のI/Oチャネルの出力部分で出力(再生)される。例えば、望ましい実施例においては、四つのメッセージシリーズが、四つの対応する遅延モード(例えば、無遅延、低遅延、中間遅延、及び高遅延モード)に対応して予め録音されている。シリーズ中の最初のメッセージは無遅延状況に関して録音されている;第二のメッセージは、低遅延すなわち軽遅延向けに、対応する最初のメッセージよりも少し長い持続時間で録音されている;第三のメッセージは、中間遅延すなわち中庸遅延向けに、対応する第二のメッセージよりも少し長い持続時間で録音されている;及び、第四のメッセージは、高遅延すなわち重遅延向けに、対応する第三のメッセージよりも少し長い持続時間で録音されている。これら一連のメッセージは、出力モジュール250中のメッセージあるいはプロンプトメモリ260にストアされていることが望ましい。
【0025】
本発明の望ましい実施例においては、二つのタイプの遅延機能が、個々に、あるいは種々の組み合わせで、もしくは互いに独立に実装されうる。例えば、第一の遅延モードは、メッセージの開始部における第一の(短い)無音期間の利用のみから構成され、(付加されたメッセージ持続時間を有さない)第一メッセージシリーズから選択される。第二の遅延モードは、第二シリーズ(低遅延メッセージ)から選択されたメッセージの利用のみから構成される。第三の遅延モードは、開始部における短い無音期間と第二シリーズ(低遅延メッセージ)から選択されたメッセージの利用の双方からなる。第四の遅延モードは、第三シリーズ(中間遅延メッセージ)から選択されたメッセージの利用のみから構成され、第五の遅延モードは、増大無音期間及び第三シリーズ(中間遅延メッセージ)の組み合わせよりなる等々である。二つのタイプの遅延機能は、本発明に従った通話者入力レート制御に係る遅延機能を実現するためのあらゆる望ましい粒度あるいは連続性を実現する目的で、無限の組み合わせで選択されうる。
【0026】
前述されているように、ASR240の入力チャネルの利用の度合に基づいて、プロセッサ210は、例えば無遅延、低遅延、中間遅延、あるいは高遅延などの種々の遅延モードを選択する。望ましい実施例に依存して、ASR240の入力チャネルの利用度の測定及び種々の遅延モードの双方は、(近似的に)連続的に、あるいは漸増的に実装される。加えて、選択された遅延モードは、現在進行中の全ての通話に対して、あるいは、現在着信した通話のみに対して、適用可能である。
【0027】
近似的に連続的な実施例では、サービスプロバイダは、ASR240の入力チャネル利用度が75%の場合(すなわち、ASR240の入力チャネルの総数のうちの75%が現在利用されている場合)を閾値として、種々の遅延モードの実装を開始する。より多くのASR240入力チャネルが用いられると、現在進行中の全ての通話に関して、対応した関連する遅延モードが用いられる。このような実装例が、図2に関連して例示される。
【0028】
現在進行中の全ての通話に対して適用可能な漸増的実施例においては、サービスプロバイダは、ASR240入力チャネルの利用度の範囲に依存して、種々の遅延モードの実装を開始する。例えば、ASR240入力チャネルの利用度が75%、すなわち、第一閾値である場合、(次の閾値に到達するまで)低遅延モードが用いられる。ASR240入力チャネルの利用度が増加して第二閾値、例えば83%に達した場合には、システムは中間遅延モードの利用を開始する。ASR240入力チャネルの利用度がさらに増加して第三閾値、例えば90%に達した場合には、システムは高遅延モードの利用を開始する。結果として、種々の漸増的な遅延モードの利用は、ASR240入力チャネルの利用度の範囲に対応して、例えば、無遅延モード(利用度が0から74%)、低遅延モード(利用度が75%から82%)、中間遅延モード(利用度が83%から89%)、及び高遅延モード(利用度が90%から100%)となる。この種の実装は、図3に例示される。
【0029】
遅延モードは、図2及び図3に示されているように、現在進行中の全ての通話に対して適用可能な連続実行プロセスとしても実装されうる。加えて、遅延モードは、以下に図4に示されているように、各々の着信通話に関して通話毎に実装されうる。
【0030】
再度図1に戻れば、通話者入力レート制御装置200は、コンセントレータ機能及び遅延機能という二つのタイプの機能を実行することによって、ASRシステム100の容量の増大を実現する。装置200のコンセントレータ機能は、アクティブな入力チャネルのみを音声認識目的でASR240に接続すること(すなわち、通話者がサービスプロバイダのメッセージを聞いているだけの出力(再生)モードのみでアクティブになっているチャネルにASR機能を提供あるいは予約しないこと)によって、より多くのI/Oチャネルが用いられることを可能にする。起こりうる過負荷状況に対する付加遅延機能は、出力(再生)モードの持続時間を増加させるように実装され、通話者が聞いている時間を増加させ、従って、入力ASRチャネルに他の通話における音声入力の認識目的で(さらには、より大量の通話を処理する目的で)利用されるより多くの時間を提供する。
【0031】
図2は、本発明に従った自動音声認識通話者入力レート制御を実現する第一の実施例を示す流れ図である。当該方法は、連続実行プロセス(すなわちループ)として(プロセッサ210内で)機能する(段階300)。本方法は(プロセッサ210によって)、まず、段階305において、例えば使用中のASR240入力チャネルの個数を決定すなわち数えることによって、ASR240入力チャネルの利用度を決定する。次に、段階310において、本方法は、ASR240入力チャネルの利用度が所定の第一閾値、例えば前述された75%、より大きいか否かを決定する。段階310において、ASR240入力チャネルの利用度が所定の第一閾値よりも大きい場合には、本方法は(プロセッサ210によって)、段階315において、ASR240入力チャネルの利用度に比例した通信遅延モードを実現する。前述されているように、この種の遅延モードは(近似的に)連続的であり、無音期間の増大とより長い持続時間のメッセージとによる前述された種々の組み合わせを利用する。遅延モードは、現在進行中の全ての通話に対しても適用される。このような遅延モードは、プロセッサ210から出力モジュール250への指示すなわちコマンドによって実装される。
【0032】
段階320では、本方法は、ASR240入力チャネルがいくつ使用中であるか、すなわち現在の利用度、を再び決定する。これは、複数の通話が終了し、また、着信されているからである。本発明の望ましい実施例においては、遅延モードはヒステリシスを有するような形態で、すなわち、利用中のASR240入力チャネルの個数が、前記第一閾値よりも低く設定された第二閾値、例えば第一閾値が利用度75%の場合には65%利用度という第二閾値、よりも低下するまで、継続される。従って、段階320におけるASR240入力チャネルの現在の利用度の決定に引き続いて、本発明は、段階325において、ASR240入力チャネル利用度が所定の第二閾値未満に低下したか(あるいは低下しているか)否かを決定する。段階325において、ASR240入力チャネル利用度が所定の第二閾値未満に低下した(あるいは低下している)場合(すなわち、使用中のASR240入力チャネル個数が段階310における所定の第一閾値よりも大きくない場合)には、本発明は、段階330において、無遅延モードに戻る(あるいは無遅延モードに留まる)。(現在使用中のASR240入力チャネルの個数で表わされる)利用度が段階325において所定の第二閾値未満に低下していない(あるいは第二閾値未満ではない)場合には、本方法は関連する(すなわち、この場合には、比例した)遅延モードを実現し続け、段階315へ戻る。段階330において無遅延モードに復帰した後、本方法は段階305へ戻り、ASR240入力チャネルの利用度を継続してモニターする。
【0033】
図3は、本発明に従った自動音声認識通話者入力レート制御を実現する第二の実施例を示す流れ図である。この第二の方法においては、四つの遅延状態(漸増)、すなわち、無遅延、低遅延、中間遅延、及び高遅延、が、ASR240入力チャネルの利用度に係る閾値(及び対応する範囲)に基づいて用いられる。加えて、ヒステリシスを実現するような閾値が、より高い遅延状態からより低い遅延状態に遷移する際に利用される。与えられたあるいは選択された遅延モードが、現在進行中の全ての通話に対して適用される。さらに、この第二の方法においては、ASR240入力チャネルの利用度決定が、種々の閾値比較段階(すなわち、以下に議論される段階405、430、440、465、470、480、505、510及び515)に内在しており(すなわち、それらと組み合わせられており)、それゆえ、個別の段階としては例示されない。(ASR240入力チャネルの利用度決定は、プロセッサ210内のカウンタの利用などの当業者には公知の様々な方法によって実現されうるものであり、実際の結果の数値の出力を必要としない。例えば、この決定は、利用度のパーセンテージあるいは比率である場合があり、また、カウントである場合がある等々である。結果として、この決定段階は、図2に関して前述されているような、ASR240入力チャネルの現在の利用度の決定のように広義に解釈されるべきである。)図2に示された方法と同様、図3に示された方法はプロセッサ210において、あらゆる遅延モードがプロセッサ210から出力モジュール250への指示すなわちコマンドを用いるように実装される。
【0034】
本発明に係る第二の方法は、(プロセッサ210内で)連続実行プロセス(すなわち、ループ)として機能する(段階400)。当該方法は、段階405において、ASR240入力チャネルの利用度が所定の第一(高)閾値、例えば前述された90%、より高いか否かを決定する。段階405において、ASR240入力チャネル利用度が当該第一(高)閾値よりも高い場合には、本方法は高遅延モードを実現し、段階410へ進む。段階405において、ASR240入力チャネル利用度が当該第一(高)閾値よりも高くない場合には、本方法は、段階440において、ASR240入力チャネル利用度が所定の第二(中間)閾値、例えば前述された83%、より高いか否かを決定する。段階440において、ASR240入力チャネル利用度が当該第二(中間)閾値よりも高い場合には、本方法は中間遅延モードを実現し、段階445へ進む。段階440において、ASR240入力チャネル利用度が当該第二(中間)閾値よりも高くない場合には、本方法は、段階480において、ASR240入力チャネル利用度が所定の第三(低)閾値、例えば前述された75%、より高いか否かを決定する。段階480において、ASR240入力チャネル利用度が当該第三(低)閾値よりも高い場合には、本方法は低遅延モードを実現し、段階485へ進む。段階480において、ASR240入力チャネル利用度が当該第三(低)閾値よりも高くない場合には、本方法は、無遅延モード(段階525)に留まり(すなわち戻り)、段階525に引き続いて、本方法はASR240入力チャネル利用度のモニターを継続して、段階405へ戻る。
【0035】
段階405において、ASR240入力チャネル利用度が所定の第一(高)閾値より高い場合には、本方法は高遅延モードを実現し、段階410へ進む。段階410では、本方法は、高遅延モードに関して第一の遅延タイプ(無音期間)がイネーブルされているか否か、すなわち、無音期間の持続時間の漸増の利用がイネーブルされているか否か、を決定し、その場合には、本方法は、段階415において、高遅延モードの実現に際して対応する(高すなわち最長)持続時間を有する無音期間を利用する。段階415に引き続いて、あるいは、段階410で無音期間の持続時間の漸増の利用がイネーブルされていない場合には、本方法は段階420へ進み、高遅延モードに関して第二の遅延タイプ(メッセージ持続期間)がイネーブルされているか否か、すなわち、高持続時間(比較的最長)の一連のメッセージあるいはプロンプトの利用がイネーブルされているか否か、を決定する。段階420において、一連の高持続時間メッセージの利用がイネーブルされている場合には、本方法は、段階425において、高遅延モードの実現に際して一連の高持続時間メッセージを利用する。
【0036】
段階425に引き続いて、あるいは、段階420において一連の高持続時間メッセージの利用がイネーブルされていない場合には、本方法は段階430へ進み、ASR240入力チャネル利用度が(通話が終了されたために)所定の第四閾値未満に低下したあるいは低下しているか否かを決定する。望ましい実施例においては、所定の第四閾値は、より短い遅延のモードへ移行する前にヒステリシス特性を実現する目的で、前記所定の第一閾値と第二閾値との間のレベルにセットされる。段階430におけるASR240入力チャネル利用度が所定の第四閾値未満に低下していない(すなわちより大きい)場合には、本方法は高遅延モードを維持し(段階435)、段階430に戻ってASR240入力チャネル利用度のモニターを継続する。段階430におけるASR240入力チャネル利用度が所定の第四閾値未満に低下した(あるいは低下している)場合には、本方法は段階440へ進み、本方法が中間遅延あるいは低遅延モードへ進むべきか否かを決定する。
【0037】
図3において、段階405あるいは430に引き続いて、段階440においてASR240入力チャネル利用度が所定の第二閾値(中間レベル)よりも大きい(しかしながら、段階405において、所定の第一閾値よりは大きくない)場合には、本方法は中間遅延モードを実現し、段階445へ進む。段階445においては、本方法は、中間遅延モードに対して第一遅延タイプ(無音期間)がイネーブルされているか否か、すなわち、無音期間増大の利用がイネーブルされているか否か、を決定し、その場合には、本方法は、段階450における中間遅延モードの実現に際して、無音期間の対応する(中間的な)持続時間を利用する。段階450に引き続いて、あるいは、段階445において無音期間増大の利用がイネーブルされていない場合には、本方法は段階455へ進み、第二遅延タイプ(メッセージ持続時間)が中間遅延モードに対してイネーブルされているか否か、すなわち、一連の中間的な持続時間を有するメッセージあるいはプロンプトの利用がイネーブルされているか否か、を決定する。段階455において一連の中間持続時間メッセージの利用がイネーブルされている場合には、本方法は、段階460において、中間遅延モードの実現に際して一連の中間持続時間メッセージを利用する。
【0038】
段階460に引き続いて、あるいは、段階455において一連の中間持続時間メッセージの利用がイネーブルされていない場合には、本方法は段階465へ進み、ASR240入力チャネル利用度が(通話の終了に伴って)所定の第五の閾値未満に低下したかあるいは低下しているか否かを決定する。望ましい実施例においては、望ましい実施例においては、所定の第五閾値は、低遅延のモードへ移行する前にヒステリシス特性を実現する目的で、前記所定の第二閾値と第三閾値との間のレベルにセットされる。段階465におけるASR240入力チャネル利用度が所定の第五閾値未満に低下した(あるいは低下している)場合には、本方法は段階480へ進み、本方法が低遅延モードへ進むべきか否かを決定する。
【0039】
段階465におけるASR240入力チャネル利用度が所定の第五閾値未満に低下していない(すなわちより大きい)場合には、本方法はASR240入力チャネル利用度が(通話が着信されたために)所定の第一閾値より大きい状態に増加したか否かを決定する(段階470)。段階470においてASR240入力チャネル利用度が所定の第一閾値より大きい状態に増加した場合には、本方法は高遅延モードに移行して段階410に戻る。段階465におけるASR240入力チャネル利用度が所定の第五閾値未満に低下しておらず(すなわち第五閾値より大きく)、かつ、所定の第一閾値よりも大きくない(段階470)場合には、本方法は中間遅延モードを維持し(段階475)、段階465へ戻ってASR240入力チャネル利用度のモニターを継続する。
【0040】
段階440あるいは465に引き続いて、段階480におけるASR240入力チャネル利用度が所定の第三(低レベル)閾値よりも大きい(しかしながら、段階440における所定の第二閾値よりは大きくない)場合には、本方法は低遅延モードを実現し、段階485へ進む。段階485では、本方法は、第一遅延タイプ(無音期間)が低遅延モードに対してイネーブルされているか否か、すなわち、無音期間増大の利用が医ネール部されているか否かを決定し、その場合には、段階490において、低遅延モードの実現に際して対応する(低すなわち最低)持続時間の無音期間を利用する。段階490に引き続いて、あるいは、段階485において無音期間増大の利用がイネーブルされていない場合には、本方法は段階495へ進み、低遅延モードに対して第二遅延タイプ(メッセージ持続時間)がイネーブルされているか否か、すなわち、一連の低持続時間メッセージの利用がイネーブルされているか否かを決定する。段階495において、一連の低持続時間メッセージの利用がイネーブルされている場合には、本方法は、段階500において、低遅延モードの実現に際して対応する一連の(低)持続時間メッセージを利用する。
【0041】
段階500に引き続いて、あるいは、段階495において一連の低持続時間メッセージの利用がイネーブルされていない場合には、本方法は段階505へ進み、ASR240入力チャネル利用度が(通話の終了に伴って)所定の第六閾値以下に低下したあるいは低下しているか否かを決定する。望ましい実施例においては、所定の第六閾値は、無遅延モードへの移行の前にヒステリシス特性を実現する目的で、所定の第三閾値よりも低いレベルに設定される。段階505において、ASR240入力チャネル利用度が所定の第六閾値未満に低下した(すなわちより低い)場合には、本方法は段階525へ進み、無遅延モードにはいる。
【0042】
段階505において、ASR240入力チャネル利用度が所定の第六閾値未満に低下していない(すなわち、より低くない)場合には、本方法は、ASR240入力チャネル利用度が(着信通話に伴って)所定の第一閾値より大きい状態に増加したか否かを決定する(段階510)。段階510において、ASR240入力チャネル利用度が所定の第一閾値よりも大きい状態に増加した場合には、本方法は高遅延モードに移行し、段階410へ進む。段階505及び510において、ASR240入力チャネル利用度が所定の第六閾値未満に低下しておらず(すなわち、第六閾値よりも大きく)、かつ、所定の第一閾値を越えるほどには増大していない場合には、本方法は、さらに、ASR240入力チャネル利用度が所定の第二閾値よりも大きい状態まで増大しているか否かを決定する(段階515)。段階515においてASR240入力チャネル利用度が所定の第二閾値よりも大きい状態まで増大している場合には、本方法は中間遅延モードに移行し、段階445に進む。ASR240入力チャネル利用度が所定の第六閾値未満に低下しておらず(すなわち、より大きく)(段階505)、かつ、所定の第一閾値あるいは第二閾値を越えるほどには増大していない(段階510及び515)場合には、本方法は低遅延モードに留まり(段階520)、段階505へ戻ってASR240入力チャネル利用度のモニターを継続する。
【0043】
図4は、本発明に従って自動音声認識通話者入力レートを実現する第三の実施例を示す流れ図である。前述されているように、この実施例の遅延モードは、各通話が着信する際に通話毎に実装される。プロセスとして連続的に実行されている場合と異なり、この第三の方法は、段階600で、ネットワークインターフェース160による通話の着信から開始される。その後、本方法は、段階605において、ASR240入力チャネルの現在の利用度を決定する。ASR240入力チャネル利用度が第一閾値より高い場合には(段階610)、遅延モードがセットされる(段階615)。次いで、本方法は、メッセージ出力に係るメッセージ持続時間及び/あるいは無音期間持続時間の決定など、着信通話に関する遅延パラメータを決定し(段階620)、通話に係るその他の処理を継続する(段階640)。
【0044】
段階610におけるASR240入力チャネル利用度が第一閾値より大きくない場合には、無遅延モードへ戻る前にヒステリシス特性を実現する目的で、本方法はASR240入力チャネル利用度が第二閾値よりも高いか否かを決定する(段階625)。段階625において、ASR240入力チャネル利用度が第二閾値よりも高い場合には、本方法は遅延モードが設定されているか否か、すなわち、遅延モードが以前の通話に関して設定されていた(利用度が以前は第一閾値よりも高かったことを意味する)か否かを決定する(段階630)。遅延モードが設定されていた場合には(段階630)、本方法は段階620へ進み、前述されているように、当該着信通話に係る遅延パラメータを決定する。遅延モードが設定されていなかった場合には(段階630)、以前の全ての遅延モードがクリアされていること(あるいは、全く設定されていなかったこと)を意味しており、本方法は段階640へ進んで、通話に係る他の処理を継続する。段階625において、ASR240入力チャネル利用度が第二閾値を越えない場合には、本方法は遅延モードをクリア、すなわち、以前に設定されていたあらゆる遅延モードをリセットする(段階635)。段階635に引き続いて、本方法は、通話に係る他の処理を継続する。
【0045】
以上に記載されたように、本発明の望ましい実施例は、自動音声認識を有するインタラクティブ通信システム向けの通話者入力レート制御を実現する。ここで、当該インタラクティブ通信システムは複数個の入力チャネル及び複数個の出力チャネルを有し、複数個のASR入力チャネルを有する自動音声認識コンポーネントを有している。本発明に従った方法は、まず、複数個のASR入力チャネルの利用度を決定する段階、次いで、複数個のASR入力チャネルの利用度が第一の所定の閾値より大きい場合に、複数個の出力チャネルのうちの単一あるいは複数の出力チャネルに係るメッセージ出力に関連する遅延モードを実現する段階、を有している。
【0046】
追加的なコンセントレータ機能は、モニターされたエネルギーレベルを生成する目的で(複数個の入力チャネルのうちの)入力チャネルのエネルギーレベルをモニターする段階;バッファされた情報を形成する目的で、以前の時間期間における入力チャネルから受信された全ての(エコー打ち消し済みの)入力をメモリバッファにストアする段階;及び、モニターされたエネルギーレベルが所定のエネルギーレベルよりも大きい場合に、バッファされた情報を複数個のASR入力チャネルのうちのASR入力チャネルに送出し、入力チャネルをASR入力チャネルに接続する段階、を有している。
【0047】
種々の関連する遅延モードは、出力チャネル上のメッセージ出力に関して、複数のメッセージ持続時間のうちからあるメッセージ持続時間を、及び、複数個の無音期間持続時間のうちからある無音期間持続時間を、それぞれ独立に、あるいは個別にもしくは組み合わせて選択することによって決定される。望ましい実施例においては、種々の関連する遅延モードは、複数個のASR入力チャネルの利用度に比例し、あるいは、複数個のASR入力チャネルの利用度の範囲に対応する。
【0048】
本発明の数々の利点は以上の議論より明らかである。第一に、利用者は、全てのASR入力チャネルが他の利用者へのサービス提供に関してビジー状態である場合においても、保留されたり切断されたりすることなく、実際にインタラクティブシステムによってサービスを提供される。第二に、本発明の種々の実施例は、与えられたすなわち固定された個数のASR入力チャネルを増加させることを要求せずにASRシステム容量を増大させ、既存のASR入力チャネルのより効率的な利用を実現する。加えて、ASR入力チャネルをより効率的に利用することによって、実際の通話者待機時間が減少し、より長い持続時間を有するプロンプトあるいはメッセージによって通話者にサービスを提供し続けることによって、見かけの待機時間も減少する。最後に、本発明によって実現された容量の増大はユーザに対して透過的であり、ユーザフレンドリーであり、混雑すなわち過負荷状況においても利用者には実効的に気付かれず、既存の自動音声認識システムにおいてコスト効率良く実装されることが可能である。
【0049】
以上の説明は、本発明の一実施例に関するもので,この技術分野の当業者であれば、本発明の種々の変形例が考え得るが、それらはいずれも本発明の技術的範囲に包含される。
【0050】
【発明の効果】
以上述べたごとく、本発明によれば、自動音声認識システムの容量を増大させる通話者入力レート制御方法、通話者入力レート制御システム、及び、通話者入力レート制御装置が提供される。
【0051】
特許請求の範囲に発明の構成要件の後の括弧内の符号が記載されている場合は、構成要件と実施例と対応づけて発明を容易に理解させる為であり、特許請求の範囲の解釈に用いるべきのものではない。
【図面の簡単な説明】
【図1】 本発明に従って自動音声認識通話者入力レート制御を実現するシステム及び装置を示すブロック図。
【図2】 本発明に従って自動音声認識通話者入力レート制御を実現する第一の方法を例示する流れ図。
【図3】 本発明に従って自動音声認識通話者入力レート制御を実現する第二の方法を例示する流れ図。
【図4】 本発明に従って自動音声認識通話者入力レート制御を実現する第三の方法を例示する流れ図。
【符号の説明】
100 自動音声認識システム
110 ネットワーク
115 交換センター
120 ルータ
125 サーバ
130 モバイル局
135 基地局
140 電話機
145 コンピュータ
160 ネットワークインターフェース
165 バス
200 通話者入力レート制御装置
210 プロセッサ
215 バス
220 メモリ
225 バス
230 オブザーバモジュール
235 バス
240 自動音声認識システム
245 通話制御モジュール
250 出力モジュール
255 メッセージ選択モジュール
260 メッセージメモリ
300 遅延モード処理
305 ASR入力チャネルの利用度を決定
310 ASR入力チャネルの利用度が所定の第一閾値より高いか?
315 ASR入力チャネルの利用度に比例した関連する遅延モードを実現
320 ASR入力チャネルの利用度を決定
325 ASR入力チャネルの利用度が所定の第二閾値より低いか?
330 無遅延モードに戻る
400 遅延モード処理
405 ASR入力チャネルの利用度が第一(高)閾値より高いか?
410 高レベル無音期間がイネーブルされているか?
415 高レベル無音期間を利用
420 高レベルメッセージ持続時間がイネーブルされているか?
425 高レベルメッセージ持続時間を利用
430 ASR入力チャネルの利用度が第四閾値未満か?
435 高遅延モードを維持
440 ASR入力チャネルの利用度が第二(中間)閾値より高いか?
445 中間レベル無音期間がイネーブルされているか?
450 中間レベル無音期間を利用
455 中間レベルメッセージ持続時間がイネーブルされているか?
460 中間レベルメッセージ持続時間を利用
465 ASR入力チャネルの利用度が第五閾値未満か?
470 ASR入力チャネルの利用度が第一閾値より高いか?
475 中間遅延モードを維持
480 ASR入力チャネルの利用度が第三(低)閾値より高いか?
485 低レベル無音期間がイネーブルされているか?
490 低レベル無音期間を利用
495 低レベルメッセージ持続時間がイネーブルされているか?
500 低レベルメッセージ持続時間を利用
505 ASR入力チャネルの利用度が第六閾値未満か?
510 ASR入力チャネルの利用度が第一閾値より高いか?
515 ASR入力チャネルの利用度が第二閾値より高いか?
520 低遅延モードを維持
525 無遅延モードを維持(あるいは無遅延モードに戻る)
600 開始: 着信
605 ASR入力チャネルの現在の利用度を決定
610 ASR入力チャネルの利用度が第一閾値より高いか?
615 遅延モードをセット
620 着信通話に係る遅延パラメータを決定
625 ASR入力チャネルの利用度が第二閾値より高いか?
630 遅延モードがセットされているか?
635 遅延モードをクリア
640 通話処理を継続

Claims (10)

  1. 自動音声認識を有するインタラクティブ通信システムにおける通話者入力レート制御を提供する方法において、前記インタラクティブ通信システムが複数個の入力チャネル及び複数個の出力チャネルを有し、前記インタラクティブ通信システムが複数個の自動音声認識入力チャネルを有し、該方法が、
    前記複数個の自動音声認識入力チャネルの現在の利用度を計算または計測するステップ、
    前記複数個の自動音声認識入力チャネルの前記利用度が所定の第一閾値よりも大きい場合に、前記複数個の出力チャネルの出力チャネルに係るメッセージ出力に対して、メッセージの持続時間が増大するように前記複数個の自動音声認識入力チャネルの前記利用度が所定の第一閾値よりも大きい場合と関連する遅延モードを実現するステップ、
    モニターされたエネルギーレベルを生成する目的で前記複数個の入力チャネルのうちの入力チャネルのエネルギーレベルをモニターするステップ、
    以前の時間期間に亘る入力チャネルから着信されたエコーキャンセル済み入力全てよりなる複数個のサンプルをメモリバッファにストアするステップ、及び
    前記モニターされたエネルギーレベルが所定のエネルギーレベルより大きい場合に、前記バッファされた情報を前記複数個の自動音声認識入力チャネルのうちの自動音声認識入力チャネルに送出し、前記入力チャネルを前記自動音声認識入力チャネルに接続するステップ
    からなる方法。
  2. 自動音声認識を有するインタラクティブ通信システムにおける通話者入力レート制御を提供する方法において、前記インタラクティブ通信システムが複数個の入力チャネル及び複数個の出力チャネルを有し、前記インタラクティブ通信システムが複数個の自動音声認識入力チャネルを有し、該方法が、
    前記複数個の自動音声認識入力チャネルの現在の利用度を計算または計測するステップ、及び
    前記複数個の自動音声認識入力チャネルの前記利用度が所定の第一閾値よりも大きい場合に、前記複数個の出力チャネルの出力チャネルに係るメッセージ出力に対して、メッセージの持続時間が増大するように前記複数個の自動音声認識入力チャネルの前記利用度が所定の第一閾値よりも大きい場合と関連する遅延モードを実現するステップであって、前記複数個の自動音声認識入力チャネルの前記利用度が所定の第一閾値よりも大きい場合と関連する遅延モードが、前記出力チャネルに係る前記メッセージ出力に対して、複数個のメッセージ持続時間のうちからあるメッセージ持続時間を、及び、複数個の無音期間持続時間のうちからある無音期間持続時間を、個々にあるいは組み合わせで独立に選択することによって決定される、ステップ
    からなる方法。
  3. 自動音声認識を有するインタラクティブ通信システムにおける通話者入力レート制御を提供する方法において、前記インタラクティブ通信システムが複数個の入力チャネル及び複数個の出力チャネルを有し、前記インタラクティブ通信システムが複数個の自動音声認識入力チャネルを有し、該方法が、
    前記複数個の自動音声認識入力チャネルの現在の利用度を計算または計測するステップ、及び
    前記複数個の自動音声認識入力チャネルの前記利用度が所定の第一閾値よりも大きい場合に、前記複数個の出力チャネルの出力チャネルに係るメッセージ出力に対して、メッセージの持続時間が増大するように前記複数個の自動音声認識入力チャネルの前記利用度が所定の第一閾値よりも大きい場合と関連する遅延モードを実現するステップであって、前記複数個の自動音声認識入力チャネルの前記利用度が所定の第一閾値よりも大きい場合と関連する遅延モードが複数個の関連する遅延モードから選択され、前記出力チャネルに係る出力に対する前記複数個の関連する遅延モードが対応する複数個の一連のメッセージを有し、ここで、前記対応する複数個の一連のメッセージは第一の一連のメッセージ及び第二の一連のメッセージを含んでおり、前記第一の一連のメッセージが前記第二の一連のメッセージと比較してより大きい漸増的遅延を有している、すなわち、前記第一の一連のメッセージのうちの各々のメッセージが前記第二の一連のメッセージのうちの各々対応するものよりも長い持続時間を有している、ステップ
    からなる方法。
  4. 自動音声認識向けの通話者入力レート制御を有するインタラクティブ通信システムにおいて、該システムが、
    複数個の入力チャネル及び複数個の出力チャネルを有するネットワークインターフェース、
    前記複数個の出力チャネルに係るメッセージ出力を行なう出力モジュール、
    複数個の自動音声認識入力チャネルを有する自動音声認識モジュール、及び
    前記複数個の入力チャネル、前記出力モジュール及び前記自動音声認識入力チャネルに接続された通話者入力レート制御モジュールであって、前記複数個の自動音声認識入力チャネルの現在の利用度を計算または計測する命令を含み、前記複数個の自動音声認識入力チャネルの前記利用度が所定の第一閾値より大きい場合に、前記出力モジュールに、前記複数個の出力チャネルのうちの出力チャネルに係るメッセージ出力にメッセージの持続時間が増大するように前記複数個の自動音声認識入力チャネルの前記利用度が所定の第一閾値よりも大きい場合と関連する遅延モードを実現させる命令を含む、通話者入力レート制御モジュール
    からなるシステム。
  5. 請求項4記載のシステムにおいて、前記通話者入力レート制御モジュールが、さらに、
    モニターされたエネルギーレベルを生成する目的で前記複数個の入力チャネルのうちの入力チャネルのエネルギーレベルをモニターさせる命令、
    以前の時間期間に亘る入力チャネルから着信されたエコーキャンセル済み入力全てよりなる複数個のサンプルをメモリバッファにストアさせる命令、
    前記モニターされたエネルギーレベルが所定のエネルギーレベルより大きい場合に、前記バッファされた情報を前記複数個の自動音声認識入力チャネルのうちの自動音声認識入力チャネルに送出し、前記入力チャネルを前記自動音声認識入力チャネルに接続させる命令
    を含むシステム。
  6. 請求項4記載のシステムにおいて、前記通話者入力レート制御モジュールが、さらに、前記出力チャネルに係る前記メッセージ出力に対して、複数個のメッセージ持続時間のうちからあるメッセージ持続時間を、及び、複数個の無音期間持続時間のうちからある無音期間持続時間を、個々にあるいは組み合わせで独立に選択することによって前記関連する遅延モードを決定させる命令を含むシステム。
  7. 請求項4記載のシステムにおいて、前記通話者入力レート制御モジュールが、さらに、前記出力チャネルに係る前記メッセージ出力に対する前記関連する遅延モードにおいて無音期間の利用を含ませるように前記出力モジュールに指示する命令を含むシステム。
  8. 請求項4記載のシステムにおいて、前記通話者入力レート制御モジュールが、さらに、前記複数個の自動音声認識入力チャネルの前記利用度が所定の第二閾値未満である場合に、前記出力チャネルに係る前記メッセージ出力に関して無遅延モードを実現させるように前記出力モジュールに指示する命令を含むシステム。
  9. 自動音声認識を有するインタラクティブ通信システムにおける通話者入力レート制御を行う装置において、該インタラクティブ通信システムが複数個の入力チャネル及び複数個の出力チャネルを有し、複数個の自動音声認識入力チャネルを有する自動音声認識コンポーネントを含み、及び前記複数個の出力チャネル上のメッセージ出力に係る出力モジュールを含み、前記装置が前記入力チャネルと、前記出力モジュールと、及び前記自動音声認識入力チャネルと接続可能であり、前記装置が、
    前記複数個の入力チャネルに接続可能なオブザーバモジュール、
    前記オブザーバモジュールに接続されており前記複数個の自動音声認識入力チャネルに接続可能なメモリ、及び
    前記オブザーバモジュール及び前記メモリに接続されたプロセッサであって、該プロセッサは、前記出力モジュール及び前記複数個の自動音声認識入力チャネルに対してさらに接続可能であり、当該プロセッサは前記複数個の自動音声認識入力チャネルの現在の利用度を計算または計測する命令を有しており、前記複数個の自動音声認識入力チャネルの前記利用度が所定の第一閾値より大きい場合に、前記出力モジュールに、前記複数個の出力チャネルのうちの出力チャネルに係るメッセージ出力に、メッセージの持続時間が増大するように前記複数個の自動音声認識入力チャネルの前記利用度が所定の第一閾値よりも大きい場合と関連する遅延モードを実現させる命令を有している、プロセッサ
    からなる装置。
  10. 自動音声認識を有するインタラクティブ通信システムにおける通話者入力レート制御を行う装置において、前記インタラクティブ通信システムが、複数個の入力チャネル及び複数個の出力チャネルを有し、複数個の自動音声認識入力チャネルを有する自動音声認識コンポーネントを含み、前記複数個の出力チャネル上のメッセージ出力に係る出力モジュールを含み、前記装置が、
    前記複数個の入力チャネルに接続可能なオブザーバモジュールであって、モニターされたエネルギーレベルを生成する目的で前記複数個の入力チャネルのうちの入力チャネルのエコー打ち消しを実現してエネルギーレベルをモニターし、前記モニターされたエネルギーレベルが所定のエネルギーレベルより大きい場合に前記入力チャネルを前記自動音声認識入力チャネルのうちの自動音声認識入力チャネルに接続するように機能するオブザーバモジュール、
    前記オブザーバモジュールに接続されており前記複数個の自動音声認識入力チャネルに接続可能なメモリであって、以前の時間期間に亘る入力チャネルから着信されたエコーキャンセル済み入力全てよりなる複数個のサンプルをストアし、かつ、前記バッファされた情報を前記自動音声認識入力チャネルに送出するように機能するメモリ、及び
    前記オブザーバモジュール及び前記メモリに接続されたプロセッサであって、前記出力モジュール及び前記複数個の自動音声認識入力チャネルに対してさらに接続可能であり、前記複数個の自動音声認識入力チャネルの現在の利用度を計算または計測する命令を含み、前記複数個の自動音声認識入力チャネルの前記利用度が所定の第一閾値より大きい場合に、前記出力モジュールに、前記複数個の出力チャネルのうちの出力チャネルに係る複数個のメッセージ出力に、メッセージの持続時間が増大するように前記複数個の自動音声認識入力チャネルの前記利用度が所定の第一閾値よりも大きい場合と関連する遅延モードを実現させる命令を含み、さらに、前記複数個の自動音声認識入力チャネルの前記利用度が所定の第二閾値より低い場合に、前記出力モジュールに、前記複数個の出力チャネルのうちの出力チャネルに係る前記複数個のメッセージ出力に無遅延モードを実現させる命令を含むプロセッサ
    からなる装置。
JP2001092258A 2000-03-29 2001-03-28 通話者入力レート制御方法、通話者入力レート制御システム、及び通話者入力レート制御装置 Expired - Fee Related JP5051945B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/537,330 US6728671B1 (en) 2000-03-29 2000-03-29 Automatic speech recognition caller input rate control
US09/537330 2000-03-29

Publications (3)

Publication Number Publication Date
JP2001320490A JP2001320490A (ja) 2001-11-16
JP2001320490A5 JP2001320490A5 (ja) 2008-05-15
JP5051945B2 true JP5051945B2 (ja) 2012-10-17

Family

ID=24142191

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001092258A Expired - Fee Related JP5051945B2 (ja) 2000-03-29 2001-03-28 通話者入力レート制御方法、通話者入力レート制御システム、及び通話者入力レート制御装置

Country Status (6)

Country Link
US (1) US6728671B1 (ja)
EP (1) EP1139334B1 (ja)
JP (1) JP5051945B2 (ja)
CA (1) CA2337368C (ja)
DE (1) DE60123696T2 (ja)
MX (1) MXPA01003126A (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7917364B2 (en) * 2003-09-23 2011-03-29 Hewlett-Packard Development Company, L.P. System and method using multiple automated speech recognition engines
US7386443B1 (en) 2004-01-09 2008-06-10 At&T Corp. System and method for mobile automatic speech recognition
US20050177371A1 (en) * 2004-02-06 2005-08-11 Sherif Yacoub Automated speech recognition
FR2881867A1 (fr) * 2005-02-04 2006-08-11 France Telecom Procede de transmission de marques de fin de parole dans un systeme de reconnaissance de la parole
US20060258308A1 (en) * 2005-05-10 2006-11-16 Fassbender Charles J Electronic device for interleaving program segments and skipping program breaks from two radio/TV broadcasts
US8433041B2 (en) * 2005-09-23 2013-04-30 Bce Inc. Method and system to enable touch-free incoming call handling and touch-free outgoing call origination
WO2007033459A1 (en) * 2005-09-23 2007-03-29 Bce Inc. Method and system to enable touch-free incoming call handling and touch-free outgoing call origination
WO2007033458A1 (en) * 2005-09-23 2007-03-29 Bce Inc. Methods and systems for touch-free call handling
CA2571009C (en) * 2005-09-23 2010-10-05 Bce Inc. Methods and systems for touch-free call origination
US8036373B2 (en) * 2006-03-07 2011-10-11 Cisco Technology, Inc. Methods and systems for providing dynamic message content to callers on hold
US8139755B2 (en) 2007-03-27 2012-03-20 Convergys Cmg Utah, Inc. System and method for the automatic selection of interfaces
US8548812B2 (en) * 2008-12-22 2013-10-01 Avaya Inc. Method and system for detecting a relevant utterance in a voice session
CN110400576B (zh) * 2019-07-29 2021-10-15 北京声智科技有限公司 语音请求的处理方法及装置
US11626105B1 (en) * 2019-12-10 2023-04-11 Amazon Technologies, Inc. Natural language processing

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58131856A (ja) * 1982-02-01 1983-08-05 Nippon Telegr & Teleph Corp <Ntt> 音声応答認識サ−ビス方式
JPS6348946A (ja) * 1986-08-18 1988-03-01 Nippon Telegr & Teleph Corp <Ntt> 音声認識処理方式
US4914692A (en) * 1987-12-29 1990-04-03 At&T Bell Laboratories Automatic speech recognition using echo cancellation
JPH04119042A (ja) * 1990-09-10 1992-04-20 Fujitsu Ltd Isdnのdチャンネル輻輳制御方式
US5311574A (en) * 1991-10-23 1994-05-10 At&T Bell Laboratories Automatic customer call back for automatic call distribution systems
JPH0792993A (ja) * 1993-09-20 1995-04-07 Fujitsu Ltd 音声認識装置
US5708704A (en) * 1995-04-07 1998-01-13 Texas Instruments Incorporated Speech recognition method and system with improved voice-activated prompt interrupt capability
US5537395A (en) * 1995-04-13 1996-07-16 Northern Telecom Limited Method and apparatus for setting a channel congestion message in a wireless multiple access packet data system
GB2325110B (en) * 1997-05-06 2002-10-16 Ibm Voice processing system
JP3450647B2 (ja) * 1997-05-13 2003-09-29 株式会社エヌ・ティ・ティ・ドコモ 交換機および音声ガイダンス報知システム
US5970446A (en) * 1997-11-25 1999-10-19 At&T Corp Selective noise/channel/coding models and recognizers for automatic speech recognition

Also Published As

Publication number Publication date
US6728671B1 (en) 2004-04-27
MXPA01003126A (es) 2005-08-26
EP1139334A2 (en) 2001-10-04
EP1139334B1 (en) 2006-10-11
DE60123696D1 (de) 2006-11-23
DE60123696T2 (de) 2007-08-23
EP1139334A3 (en) 2002-09-11
CA2337368C (en) 2006-09-12
JP2001320490A (ja) 2001-11-16
CA2337368A1 (en) 2001-09-29

Similar Documents

Publication Publication Date Title
JP5051945B2 (ja) 通話者入力レート制御方法、通話者入力レート制御システム、及び通話者入力レート制御装置
US6751306B2 (en) Local on-hold information service with user-controlled personalized menu
EP1414227B1 (en) Event detection for multiple voice channel communications
US6738473B1 (en) Call queuing
US6272216B1 (en) Customer self routing call center
US6665396B1 (en) Call hold manager system and method
JP2002503423A (ja) ネットワークベースのコール継続サービスのためのシステムおよび方法
US6778660B2 (en) Customer interaction system
JP2000092213A (ja) 待ち行列を用いて処理するのにスキルを必要とする通信を処理する方法および装置
AU2018408409B2 (en) Techniques for behavioral pairing in a contact center system
US8160234B2 (en) Assignment of call-center agents to incoming calls
US20050135575A1 (en) Tuning an interactive voise response system
US20110002230A1 (en) Quality of Service Parameter Relaxation for Non-Conversational Voice Calls Over a Packet-Switched Network
US7123709B1 (en) Method for audio stream monitoring on behalf of a calling party
CN101072257A (zh) 实现语音数据共享的方法和智能终端
JP3770376B2 (ja) Ipネットワークにおける保留音送出システム及び保留音送出方法
JPH11308373A (ja) 情報通信装置
GB2366142A (en) Call setup
JP7127598B2 (ja) 予約管理サーバ、予約管理方法及び予約管理プログラム
US20060008072A1 (en) Telephony system and method
JP2005184447A (ja) 呼接続制御システム、呼接続制御装置、呼接続制御方法、プログラム
WO2012088966A1 (zh) 呼叫系统及方法
WO2011032335A1 (zh) 留言管理方法及装置
JPH01245651A (ja) 待合せ時間通知方式
EP0847175A1 (en) Forced inter-switch call routing

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080328

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080328

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101018

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101025

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110125

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20110125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110822

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111117

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120625

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120724

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150803

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees