JP2001320490A - 通話者入力レート制御方法、通話者入力レート制御システム、及び通話者入力レート制御装置 - Google Patents

通話者入力レート制御方法、通話者入力レート制御システム、及び通話者入力レート制御装置

Info

Publication number
JP2001320490A
JP2001320490A JP2001092258A JP2001092258A JP2001320490A JP 2001320490 A JP2001320490 A JP 2001320490A JP 2001092258 A JP2001092258 A JP 2001092258A JP 2001092258 A JP2001092258 A JP 2001092258A JP 2001320490 A JP2001320490 A JP 2001320490A
Authority
JP
Japan
Prior art keywords
output
input
rate control
speech recognition
channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001092258A
Other languages
English (en)
Other versions
JP5051945B2 (ja
JP2001320490A5 (ja
Inventor
Mark Alan Johnson
アラン ジョンソン マーク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia of America Corp
Original Assignee
Lucent Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lucent Technologies Inc filed Critical Lucent Technologies Inc
Publication of JP2001320490A publication Critical patent/JP2001320490A/ja
Publication of JP2001320490A5 publication Critical patent/JP2001320490A5/ja
Application granted granted Critical
Publication of JP5051945B2 publication Critical patent/JP5051945B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)

Abstract

(57)【要約】 【課題】 通話者入力チャネル数を増加させることなく
自動音声認識システムの容量を増大させる装置、方法及
びシステムを実現することが本発明の課題である。 【解決手段】 本発明は、自動音声認識(ASR)シス
テムの容量を、コンセントレータ機能及び遅延機能を実
行することによって増大させる。本発明に係るコンセン
トレータ機能は、アクティブな通話者入力チャネルのみ
を音声認識目的のASR入力チャネルに切り替えること
によって、より多くの個数の通話者入出力チャネルが用
いられることを可能にする。遅延機能は、出力(再生)
モードの持続時間を増加させるように実装されており、
そのことによって、通話者が聞いているだけの時間を増
加させ、従って、入力ASRチャネルが他の通話に係る
音声入力を認識する(及び、望むらくは、より多くの通
話量を処理する)目的で用いられる時間をより多く実現
する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は自動音声認識システ
ムに関し、特に、インタラクティブ情報通信システムに
おいて用いられる自動音声認識システムに対する通話者
の入力レートを制御する装置、方法及びシステムに関す
る。
【0002】
【従来の技術】自動音声認識システムは、種々のインタ
ラクティブ通信及びその他のサービスにおいて幅広く用
いられるようになってきている。例えば、自動音声認識
システムは、航空会社フライト情報システム、音声ダイ
アル通信システム、及び(音声合成を利用する)電子メ
ール読み出しなどのインタラクティブシステムにおける
可聴音プロンプトに対する音声応答を認識する目的で用
いられている。
【0003】しかしながら、自動音声認識システムは、
通常32から64という、限られた固定数の入力チャネ
ルしか有していない。従来技術に係る音声認識システム
は、これら入力チャネルを通話者(あるいは他のユー
ザ)当たりに割り当てる。結果として、全ての入力チャ
ネルが使用中であると、その後の通話者は、通常、入力
チャネルが利用可能になるまでの間、保留される。ある
種のシステムは、保留にしている通話者宛に音楽あるい
はアナウンスを提供し、別の種類のシステムは、通話者
に、通話者が待ち行列におかれていることに係る情報を
提供する。より混雑が激しくなった場合には、利用者
は、別の時刻に再度電話をかけるように通知され、その
通話が切断されることになる。
【0004】
【発明が解決しようとする課題】残念ながら、過負荷状
況に対するこの種の通話保留あるいは通話切断は、利用
者に、通常不満あるいはいらだちを起こさせる。通話者
は、通常、待ち行列におかれることを好まず、さらには
憤慨する可能性もある。従って、サービスプロバイダ
は、利用者のサービス要求を、タイムリーに、ユーザフ
レンドリーに、効率的に、かつ、対費用効果がよくなる
ように充足させることを望んでいる。
【0005】従って、通話者入力チャネルの固定数を増
加させることなく自動音声認識システムの容量を増大さ
せる装置、方法及びシステムを実現する要求が存在す
る。このようにして増大させられた容量は、ユーザに対
して透過的で、ユーザフレンドリーで、かつ、混雑すな
わち過負荷状況の場合に利用者に対して実質的に認識不
能であるべきである。このようにして増大させられた容
量は、既存の自動音声認識システムにおいて、通話者入
力チャネルの固定数に拘わらずに容量を増大し、対費用
効果が望ましいものであるように実装されることが可能
であるべきである。
【0006】
【課題を解決するための手段】本発明の種々の実施例
は、自動音声認識(ASR)システムの容量を、主とし
て二つのタイプの機能、すなわち、コンセントレータ機
能及び遅延機能、を実行することによって増大させる。
本発明に係るコンセントレータ機能は、アクティブな通
話者入力チャネルのみを音声認識目的のASR入力チャ
ネルに切り替えること(すなわち、通話者がサービスプ
ロバイダのメッセージを聞いているような出力(再生)
モードのみに関してアクティブであるチャネルに対して
ASR機能を提供しないあるいは予約しないこと)によ
って、より多くの個数の通話者入出力(I/O)チャネ
ルが用いられることを可能にする。遅延機能は、起こり
うる過負荷状況に係るものであり、出力(再生)モード
の持続時間を増加させるように実装されており、そのこ
とによって、通話者が聞いているだけの時間を増加さ
せ、従って、入力ASRチャネルが他の通話に係る音声
入力を認識する(及び、望むらくは、より多くの通話量
を処理する)目的で用いられる時間をより多く実現す
る。遅延機能は、入力プロンプトとして通話者に対して
再生されるメッセージの持続時間を増大させること、及
び、通話者に対して再生される種々のメッセージの開始
部あるいはその途中に無音期間を挿入すること、のいず
れかあるいはその双方の遅延タイプを用いて実装される
ことが望ましい。
【0007】自動音声認識に係る本発明に従った通話者
入力レート制御を有する望ましいインタラクティブ通信
システムは、第一に、入力チャネル及び出力チャネルを
有するネットワークインターフェース;第二に、出力チ
ャネル上のメッセージ出力に係る出力モジュール;第三
に、ASR入力チャネルを有する自動音声認識モジュー
ル;及び、入力チャネル、出力モジュール及びASR入
力チャネルに対して接続された通話者入力レート制御モ
ジュールを有している。通話者入力レート制御モジュー
ルは、ASR入力チャネルの利用レベル(利用度)を決
定するインストラクションを有しており、ASR入力チ
ャネルの利用度が所定の第一閾値よりも大きい場合に
は、出力モジュールに、出力チャネル上のメッセージ出
力に対して関連する遅延モードを実現するように指示す
る。
【0008】通話者入力レート制御モジュールは、入力
チャネルのエネルギーレベルをモニターし、直前の時間
期間において入力チャネルから受信した入力の全てをメ
モリバッファにストアしてバッファ済み情報を構成する
ことによって、コンセントレータ機能を実現する。与え
られた入力チャネルのモニターされたエネルギーレベル
が所定のエネルギーレベルよりも大きい場合には、通話
者入力レート制御モジュールはバッファ済み情報をAS
R入力チャネルに送信し、音声認識目的でその入力チャ
ネルをASR入力チャネルに接続する。
【0009】通話者入力レート制御モジュールは、複数
個のメッセージ持続期間からあるメッセージ持続期間を
選択すること、及び、複数個の無音持続期間からある無
音持続期間を選択すること、を個々に行なうかあるいは
組み合わせて行なうことによって、関連する遅延モード
を決定する。関連する遅延モードは、ASR入力チャネ
ルの利用度に比例するか、あるいは、ASR入力チャネ
ルの利用度の範囲あるいは増分に対応する。
【0010】本発明に係る種々の利点には、全てのAS
R入力チャネルが他の通話者に対してサービスを提供す
るために占有されている場合においても、通話者を保留
にしたり通話を切断することなく、インタラクティブシ
ステムによって通話者に対して実際にサービスが提供さ
れることが含まれる。第二に、本発明の種々の実施例
は、与えられたあるいは固定された個数のASR入力チ
ャネルを増大を要求することなくASRシステムの容量
を増大させ、既存のASR入力チャネルをより効率的に
利用させる。加えて、ASR入力チャネルをより効率的
にりようすることによって、実際の通話者待機時間が減
少し、より長い持続時間を有するプロンプトあるいはメ
ッセージを介して通話者にサービスを提供し続けること
によって、見かけの待機時間も減少する。最後に、本発
明によって実現された容量の増大はユーザに対して透過
的であり、ユーザフレンドリーであり、混雑すなわち過
負荷状態における利用者にとっては実効的に認識不能で
あり、及び、既存の自動音声認識システムにおいて対費
用効果を充分に有するように実装されることが可能であ
る。
【0011】
【発明の実施の形態】本発明の実施例には種々の変形例
が考えられるが、以下、本明細書においては、特定の実
施例に関連して詳細に図示及び記述される。本明細書に
おける技術開示は本発明の原理を例示するものであり、
本発明を例示された特定の実施例に限定するものではな
いことに留意されたい。
【0012】前述されているように、自動音声認識
(“ASR”)システムの容量を増大させることに対す
る要求が依然として存在する。本発明に従って、与えら
れたあるいは固定された数のASR入力チャネルの対応
する増加を要求することなく、この種のASR容量を増
大させる装置、方法及びシステムが以下に例示される。
加えて、本発明に従って実現された容量増大は、ユーザ
に対して透過的であり、ユーザフレンドリーであり、混
雑すなわち過負荷状態における利用者にとっては実効的
に認識不能である。本発明の種々の実施例は、ASRシ
ステムの実際の待機時間及び見かけの待機時間(及び/
あるいは保留時間)の双方を減少させ、ユーザ及びサー
ビスプロバイダの満足感を増大させる。本発明によって
実現されたシステム容量増大は、既存の自動音声認識シ
ステムにおいて高い対費用効果で実装されることが可能
であり、与えられた、既存の個数のASR通話者入力チ
ャネルをより効率的に利用することが可能になり、及
び、ASR通話者入力チャネルの個数及び対応する資本
支出の増加を必要とすることなく、システム容量増大を
実現する。
【0013】本発明は、自動音声認識を利用するインタ
ラクティブ通信システムに係る種々の経験的な観察結果
を活用する。より詳細に述べれば、この種のインタラク
ティブシステムにおいては、通話者が、サービスプロバ
イダからのプロンプト、メッセージあるいは他の情報を
聞いている種々の時間期間が存在し、これらの時間期間
の間は全ての対応するASR入力チャネルがアイドル状
態にあって、現時点でのプロンプトあるいはメッセージ
に対する通話者からの応答を待機している。本発明は、
このような、従来技術においてはASRのアイドル期間
であったものを、以下に議論されるコンセントレータ機
能を用いて、他の通話者に対する音声認識サービスを実
現する目的で利用する。加えて、混雑すなわち過負荷に
なっている時間期間においては、本発明は、以下に議論
される遅延機能を用いて、通話者に対して再生されるメ
ッセージ(プロンプト)の持続時間を修正して増大さ
せ、このことによって、通話者が聞いているだけの時間
を透過的に増大させる。結果として、本発明の種々の実
施例は、通話者に対するサービス供給を継続しつつ、同
時に、ASR入力チャネルに係るより多くの時間が他の
通話に対して用いられることを必要に応じて可能にし、
この種の制限されたASR入力チャネル数に起因する過
負荷すなわち“ボトルネック”状況を減少させる。
【0014】本発明の種々の実施例においては、プロン
プトあるいは他のメッセージの持続時間が、単一あるい
は複数個のメッセージの持続時間をより長くすること及
びメッセージ間の無音時間期間を増大させることの双方
によって、通話者にとって知覚不能であるように、増加
させられる。この時間の間、ASR入力チャネルは、例
えば、対応するプロンプトあるいは他のメッセージに対
して音声応答している通話者のような他のアクティブ通
話に係る音声認識に関して用いられる。あらゆる持続時
間のプロンプトの後に、利用者が発話することによって
応答する場合には、利用可能なASR入力チャネルがそ
の応答の認識に対して利用され、その応答の後には、A
SR入力チャネルが再び他の通話者の応答認識に関して
利用可能になる。
【0015】それゆえ、本発明に従って、利用者は、全
てのASR入力チャネルが他の利用者に対してサービス
を提供しているためにビジー状態である場合において
も、保留されたり通話を切断されたりすることなく、実
際にインタラクティブシステムによってサービスを提供
されることになる。結果として、本発明の種々の実施例
は、既存のASR入力チャネルをより効率的に利用する
こと及び“負荷時の上品な低下”として当業者には既知
の手法を実現することの双方によって、ASRシステム
容量を増大させる。加えて、ASR入力チャネルをより
効率的に用いることによって、通話者にとっての実際の
待機(あるいは保留)時間が減少し、より長い持続時間
を有するプロンプトあるいはメッセージを介して通話者
にサービスを提供し続けることによって、見かけの待機
時間も減少する。
【0016】図1は、本発明の実施例に従って自動音声
認識通話者入力レート制御を実現するシステム100及
び装置200を示すブロック図である。図1に示されて
いるように、インタラクティブシステム100は、ネッ
トワークインターフェース160、出力(すなわち再
生)モジュール250、通話者入力レート制御モジュー
ルあるいは装置200、自動音声認識(ASR)システ
ム(コンポーネントあるいはモジュール)240、及
び、オプションとしての通話制御モジュール245を有
している。通話制御モジュール245は、例えば航空会
社フライト情報、株価市況サービス、電子メール読み上
げ、あるいは音声ダイアルなどの選択されたサービスに
対応して、(例えば航空機の到着時刻あるいは株価市況
などの)選択された情報を供給し、電子メールメッセー
ジを読み上げ、あるいは、(電話のダイアリングなど
の)他の選択されたサービスを実行する。ネットワーク
インターフェース160は、出力モジュール250から
通話者に対するメッセージあるいはプロンプトの再生す
る出力や、通話者の音声を通話者入力レート制御装置2
00及びASR240へ供給する入力として機能する、
システム100の通話者入出力(“I/O”)を実現す
る。
【0017】ネットワークインターフェース160は、
公衆交換電話網(“PSTN”)、総合デジタルサービ
ス網(“ISDN”)あるいは他のデジタルネットワー
ク、及び/あるいはインターネットなどのパケットベー
スネットワークなど、単一あるいは複数個のネットワー
ク110に接続されている。ネットワーク110は、
(有線あるいは無線の)交換センター115、ルータ1
20、及びサーバ125からなる種々のシステムに接続
されており、これらは、電話機140(あるいは他の利
用者邸内装置)、(基地局135経由の)モバイルユニ
ット130(例えばセルラ電話機あるいはPCS電話
機)、及びコンピュータ145(あるいは他のネットワ
ークアクセスデバイス)などを介して、通話者と他の利
用者との間の通信を実現する。これらのあらゆる種々の
通信メディアを介して、通話者あるいは他の利用者は、
航空会社フライト情報、音声ダイアリング、あるいは電
子メール読み出しなどのインタラクティブASRサービ
スを利用するためにシステム100にアクセスする。
【0018】図1において、ASR240は、種々のプ
ロンプトに対する通話者の応答の認識などの音声認識を
実行する。ASR240は、通常、図1のバス215部
分に示されているように、固定数、例えば“S”個の入
力チャネルを有している。本発明に従って、システム1
00により大きな容量を実現する目的で、ネットワーク
インターフェース160がASR240に非悪してより
多くの個数のI/Oチャネル、例えば“R“個のI/O
チャネルを有している(各I/O対を1チャネルと数
え、この際にR>Sである(図1のバス165に示され
ているように、R個の入力チャネルが装置200に対し
てバス225を介して接続されており、R個の出力チャ
ネルがバス235を介して出力モジュール250に接続
されている))。
【0019】通話制御モジュール245は、選択された
サービスに応答して、ASR240から受信された入力
に従って種々のサービスを実現する。例えば、ASR2
40からの認識された音声に依存して、通話制御モジュ
ール245は、(出力モジュール250の)メッセージ
選択モジュール255に、航空会社のフライト番号を要
求するプロンプトを提供させ、その後の音声認識に従っ
て、通話制御モジュール245が特定のフライトに係る
情報に関してデータベース(図示せず)をアクセスし
て、出力モジュール250に対応するフライトの到着あ
るいは出発時刻に係る出力を(ネットワークインターフ
ェース160)を介して出力させる。
【0020】本発明に従って、通話者入力レート制御装
置200は、オブザーバモジュール230、プロセッサ
210、及びメモリ220を有することが望ましい。オ
ブザーバモジュール230は、エコーキャンセラ及びエ
ネルギーデテクタを有している。オブザーバモジュール
230のエコーキャンセラ部分は、ネットワークインタ
ーフェース160の入力において検出された発信メッセ
ージからあらゆるエコーを除去する。オブザーバモジュ
ール230のエネルギーデテクタ部分は、ネットワーク
インターフェース160の複数個の入力チャネル225
の各々におけるエネルギー(すなわち、電力と等価であ
る)を検出する目的で用いられ、通話者が話し始めたこ
と、すなわち、対応する入力チャネルがASR240に
よる音声認識によって処理されるべきであることを示
す。本発明の望ましい実施例においては、オブザーバモ
ジュール230は、−40dBmの背景雑音レベルに対
しては、およそ−30dBmでのエネルギー検出を実行
する。メモリ220は、例えば種々のタイプのランダム
アクセスメモリ(RAM)、DRAM、SRAMあるい
はMRAMなどのデータストレージ集積回路(“I
C”)、あるいは他の回路あるいは装置であって、(少
なくともその一部が)サーキュラーバッファとして実装
されていることが望ましい。本発明の望ましい実施例に
おいては、メモリ220は、全ての入力チャネル225
からの所定の量の(音声あるいは無音の)最新のサンプ
ルをストアする。通話者からの音声の損失を防止する目
的で、オブザーバモジュール230があらゆる与えられ
た入力チャネル225上でエネルギー(入力音声)を検
出した際には、その入力チャネルに対応するストアされ
た(音声)サンプルが、当該チャネル上の現在の全ての
入力音声に加えて、ASR240に対して認識目的で送
出される。結果として、(検出されたエネルギーレベル
によって表わされているように)入力チャネルがアクテ
ィブの場合にのみネットワークインターフェース160
からの入力チャネルをASR240に対して接続する
(すなわち、ネットワークインターフェース160から
の入力チャネルをオブザーバ230及びメモリ220を
介してASR240に接続する)ことによって、装置2
00のオブザーバモジュール230及びメモリ220は
(プロセッサ210と共に)コンセントレータ機能を有
することになり、ASR240の入力チャネル数(S)
と比較してより大きな個数(R)の入力チャネル225
が用いられることが可能になり、よって、(ASR24
0の入力チャネル数を増加させることなく)システム1
00の容量を増大することが可能になる。
【0021】図1では、装置200のプロセッサ210
は、単一の集積回路(“IC”)を含むか、あるいは、
例えばマイクロプロセッサ、デジタルシグナルプロセッ
サ(“DSP”)、アプリケーションスペシフィック集
積回路(“ASIC”)、フィールドプログラマブルゲ
ートアレイ(“FPGA”)、関連するメモリ(例えば
RAM、DRAM、SRAM、MRAM及びROM)、
及び他のIC及びコンポーネントなどによって構成され
た複数個の集積回路及び他のコンポーネントを含んでい
る。結果として、本明細書においては、プロセッサとい
う術語は、関連するメモリ、例えばマイクロプロセッサ
メモリあるいは外部RAM、DRAM、SRAM、MR
AM、ROM、EPROM、E2PROMなどと共に機
能する単一のプロセッサ、あるいは、プロセッサ、マイ
クロプロセッサ、コントローラなどからなる配置、前述
及び図2から図4に関連して以下に詳述される機能を実
行する他のある種の集積回路群を等価的に意味していて
含んでいることに留意されたい。前述及び図2から図4
に関連して以下に詳述される本発明に係る方法論は、プ
ログラムされ、プロセッサ210及びその関連するメモ
リ(及び/あるいはメモリ220)及び他の等価なコン
ポーネントに、プロセッサ210が動作している(すな
わち、電源が投入されていて機能している)際に実行さ
れるプログラムインストラクション(あるいは等価な配
置もしくはプログラム)の組としてストアされる。(言
い換えれば、プロセッサ210及びその関連するコンポ
ーネント及び他の等価なコンポーネントが、全体として
あるいはその一部がFPGA及び/あるいはASICに
実装されている場合には、FPGAあるいはASIC
が、本発明の方法論を実装するように設計されて配置あ
るいは配線されている。)本発明の望ましい実施例にお
いては、プロセッサ210は、オブザーバモジュール2
30及びASR240の機能を実装していて実行する。
【0022】前述されたコンセントレータ機能の促進及
び増大に加えて、プロセッサ210は本発明に係る種々
の遅延機能を実現する。例えば、ASR240の入力チ
ャネルの利用度合に基づいて、プロセッサ210は、例
えば無遅延、軽(低)遅延、中庸(中間)遅延、あるい
は重(高)遅延といった種々の遅延モードを選択するこ
とが可能である。前述されているように、本発明は、
(出力モジュール250を介して)通話者に再生される
プロンプトあるいは他のメッセージの持続時間の増大、
及び、これらプロンプトあるいは他のメッセージ中の無
音期間の持続時間の増大、という二つのタイプの遅延機
能を利用する。これら二つのタイプの遅延機能は、互い
に独立に実装されることが可能であり、また、個々にあ
るいは互いに組み合わせて実装することも可能である。
以下に詳細に議論されるように、この種の遅延機能は連
続的(図2)あるいは漸増的(図3)に実装されうる。
加えて、このような遅延機能は、進行中の全ての通話に
係る連続的に実行されるプロセスとして実装されること
が可能であり、また、(通話毎に)受信した各通話に関
して実装されることも可能である。
【0023】本発明の望ましい実施例における、プロセ
ッサ210による遅延実現の一つの形態は、出力モジュ
ール250によって再生されるメッセージ(あるいはプ
ロンプト)内の無音期間の持続時間の増大である。例え
ば、プロンプトの開始部における50から2000ミリ
秒のオーダーの遅延(すなわち、開始部の無音期間)
は、一般的には利用者に認識されない。種々の持続時間
を有する他の無音期間も、メッセージあるいはプロンプ
ト中に用いられる発話間に挿入可能である。本発明の望
ましい実施例においては、この種の付加すなわち挿入さ
れる無音期間が、メッセージ/プロンプトの開始部に用
いられ、さらに、ある程度(対応するメッセージあるい
はプロンプトが、ぎこちなくあるいは人工的ではなく、
受認可能であると認識され続ける程度)はメッセージ/
プロンプト内で用いられる。
【0024】本発明の望ましい実施例においては、利用
者に対する透過性を最大にする目的で、選択されたサー
ビスに関して通話者に対して供給される(プロンプトな
どの)メッセージが、種々の相異なった持続時間を有す
る一連の(シリーズ)メッセージとして予め録音されて
いる。これらは、出力モジュール250を介して、ネッ
トワークインターフェース160のI/Oチャネルの出
力部分で出力(再生)される。例えば、望ましい実施例
においては、四つのメッセージシリーズが、四つの対応
する遅延モード(例えば、無遅延、低遅延、中間遅延、
及び高遅延モード)に対応して予め録音されている。シ
リーズ中の最初のメッセージは無遅延状況に関して録音
されている;第二のメッセージは、低遅延すなわち軽遅
延向けに、対応する最初のメッセージよりも少し長い持
続時間で録音されている;第三のメッセージは、中間遅
延すなわち中庸遅延向けに、対応する第二のメッセージ
よりも少し長い持続時間で録音されている;及び、第四
のメッセージは、高遅延すなわち重遅延向けに、対応す
る第三のメッセージよりも少し長い持続時間で録音され
ている。これら一連のメッセージは、出力モジュール2
50中のメッセージあるいはプロンプトメモリ260に
ストアされていることが望ましい。
【0025】本発明の望ましい実施例においては、二つ
のタイプの遅延機能が、個々に、あるいは種々の組み合
わせで、もしくは互いに独立に実装されうる。例えば、
第一の遅延モードは、メッセージの開始部における第一
の(短い)無音期間の利用のみから構成され、(付加さ
れたメッセージ持続時間を有さない)第一メッセージシ
リーズから選択される。第二の遅延モードは、第二シリ
ーズ(低遅延メッセージ)から選択されたメッセージの
利用のみから構成される。第三の遅延モードは、開始部
における短い無音期間と第二シリーズ(低遅延メッセー
ジ)から選択されたメッセージの利用の双方からなる。
第四の遅延モードは、第三シリーズ(中間遅延メッセー
ジ)から選択されたメッセージの利用のみから構成さ
れ、第五の遅延モードは、増大無音期間及び第三シリー
ズ(中間遅延メッセージ)の組み合わせよりなる等々で
ある。二つのタイプの遅延機能は、本発明に従った通話
者入力レート制御に係る遅延機能を実現するためのあら
ゆる望ましい粒度あるいは連続性を実現する目的で、無
限の組み合わせで選択されうる。
【0026】前述されているように、ASR240の入
力チャネルの利用の度合に基づいて、プロセッサ210
は、例えば無遅延、低遅延、中間遅延、あるいは高遅延
などの種々の遅延モードを選択する。望ましい実施例に
依存して、ASR240の入力チャネルの利用度の測定
及び種々の遅延モードの双方は、(近似的に)連続的
に、あるいは漸増的に実装される。加えて、選択された
遅延モードは、現在進行中の全ての通話に対して、ある
いは、現在着信した通話のみに対して、適用可能であ
る。
【0027】近似的に連続的な実施例では、サービスプ
ロバイダは、ASR240の入力チャネル利用度が75
%の場合(すなわち、ASR240の入力チャネルの総
数のうちの75%が現在利用されている場合)を閾値と
して、種々の遅延モードの実装を開始する。より多くの
ASR240入力チャネルが用いられると、現在進行中
の全ての通話に関して、対応した関連する遅延モードが
用いられる。このような実装例が、図2に関連して例示
される。
【0028】現在進行中の全ての通話に対して適用可能
な漸増的実施例においては、サービスプロバイダは、A
SR240入力チャネルの利用度の範囲に依存して、種
々の遅延モードの実装を開始する。例えば、ASR24
0入力チャネルの利用度が75%、すなわち、第一閾値
である場合、(次の閾値に到達するまで)低遅延モード
が用いられる。ASR240入力チャネルの利用度が増
加して第二閾値、例えば83%に達した場合には、シス
テムは中間遅延モードの利用を開始する。ASR240
入力チャネルの利用度がさらに増加して第三閾値、例え
ば90%に達した場合には、システムは高遅延モードの
利用を開始する。結果として、種々の漸増的な遅延モー
ドの利用は、ASR240入力チャネルの利用度の範囲
に対応して、例えば、無遅延モード(利用度が0から7
4%)、低遅延モード(利用度が75%から82%)、
中間遅延モード(利用度が83%から89%)、及び高
遅延モード(利用度が90%から100%)となる。こ
の種の実装は、図3に例示される。
【0029】遅延モードは、図2及び図3に示されてい
るように、現在進行中の全ての通話に対して適用可能な
連続実行プロセスとしても実装されうる。加えて、遅延
モードは、以下に図4に示されているように、各々の着
信通話に関して通話毎に実装されうる。
【0030】再度図1に戻れば、通話者入力レート制御
装置200は、コンセントレータ機能及び遅延機能とい
う二つのタイプの機能を実行することによって、ASR
システム100の容量の増大を実現する。装置200の
コンセントレータ機能は、アクティブな入力チャネルの
みを音声認識目的でASR240に接続すること(すな
わち、通話者がサービスプロバイダのメッセージを聞い
ているだけの出力(再生)モードのみでアクティブにな
っているチャネルにASR機能を提供あるいは予約しな
いこと)によって、より多くのI/Oチャネルが用いら
れることを可能にする。起こりうる過負荷状況に対する
付加遅延機能は、出力(再生)モードの持続時間を増加
させるように実装され、通話者が聞いている時間を増加
させ、従って、入力ASRチャネルに他の通話における
音声入力の認識目的で(さらには、より大量の通話を処
理する目的で)利用されるより多くの時間を提供する。
【0031】図2は、本発明に従った自動音声認識通話
者入力レート制御を実現する第一の実施例を示す流れ図
である。当該方法は、連続実行プロセス(すなわちルー
プ)として(プロセッサ210内で)機能する(段階3
00)。本方法は(プロセッサ210によって)、ま
ず、段階305において、例えば使用中のASR240
入力チャネルの個数を決定すなわち数えることによっ
て、ASR240入力チャネルの利用度を決定する。次
に、段階310において、本方法は、ASR240入力
チャネルの利用度が所定の第一閾値、例えば前述された
75%、より大きいか否かを決定する。段階310にお
いて、ASR240入力チャネルの利用度が所定の第一
閾値よりも大きい場合には、本方法は(プロセッサ21
0によって)、段階315において、ASR240入力
チャネルの利用度に比例した通信遅延モードを実現す
る。前述されているように、この種の遅延モードは(近
似的に)連続的であり、無音期間の増大とより長い持続
時間のメッセージとによる前述された種々の組み合わせ
を利用する。遅延モードは、現在進行中の全ての通話に
対しても適用される。このような遅延モードは、プロセ
ッサ210から出力モジュール250への指示すなわち
コマンドによって実装される。
【0032】段階320では、本方法は、ASR240
入力チャネルがいくつ使用中であるか、すなわち現在の
利用度、を再び決定する。これは、複数の通話が終了
し、また、着信されているからである。本発明の望まし
い実施例においては、遅延モードはヒステリシスを有す
るような形態で、すなわち、利用中のASR240入力
チャネルの個数が、前記第一閾値よりも低く設定された
第二閾値、例えば第一閾値が利用度75%の場合には6
5%利用度という第二閾値、よりも低下するまで、継続
される。従って、段階320におけるASR240入力
チャネルの現在の利用度の決定に引き続いて、本発明
は、段階325において、ASR240入力チャネル利
用度が所定の第二閾値未満に低下したか(あるいは低下
しているか)否かを決定する。段階325において、A
SR240入力チャネル利用度が所定の第二閾値未満に
低下した(あるいは低下している)場合(すなわち、使
用中のASR240入力チャネル個数が段階310にお
ける所定の第一閾値よりも大きくない場合)には、本発
明は、段階330において、無遅延モードに戻る(ある
いは無遅延モードに留まる)。(現在使用中のASR2
40入力チャネルの個数で表わされる)利用度が段階3
25において所定の第二閾値未満に低下していない(あ
るいは第二閾値未満ではない)場合には、本方法は関連
する(すなわち、この場合には、比例した)遅延モード
を実現し続け、段階315へ戻る。段階330において
無遅延モードに復帰した後、本方法は段階305へ戻
り、ASR240入力チャネルの利用度を継続してモニ
ターする。
【0033】図3は、本発明に従った自動音声認識通話
者入力レート制御を実現する第二の実施例を示す流れ図
である。この第二の方法においては、四つの遅延状態
(漸増)、すなわち、無遅延、低遅延、中間遅延、及び
高遅延、が、ASR240入力チャネルの利用度に係る
閾値(及び対応する範囲)に基づいて用いられる。加え
て、ヒステリシスを実現するような閾値が、より高い遅
延状態からより低い遅延状態に遷移する際に利用され
る。与えられたあるいは選択された遅延モードが、現在
進行中の全ての通話に対して適用される。さらに、この
第二の方法においては、ASR240入力チャネルの利
用度決定が、種々の閾値比較段階(すなわち、以下に議
論される段階405、430、440、465、47
0、480、505、510及び515)に内在してお
り(すなわち、それらと組み合わせられており)、それ
ゆえ、個別の段階としては例示されない。(ASR24
0入力チャネルの利用度決定は、プロセッサ210内の
カウンタの利用などの当業者には公知の様々な方法によ
って実現されうるものであり、実際の結果の数値の出力
を必要としない。例えば、この決定は、利用度のパーセ
ンテージあるいは比率である場合があり、また、カウン
トである場合がある等々である。結果として、この決定
段階は、図2に関して前述されているような、ASR2
40入力チャネルの現在の利用度の決定のように広義に
解釈されるべきである。)図2に示された方法と同様、
図3に示された方法はプロセッサ210において、あら
ゆる遅延モードがプロセッサ210から出力モジュール
250への指示すなわちコマンドを用いるように実装さ
れる。
【0034】本発明に係る第二の方法は、(プロセッサ
210内で)連続実行プロセス(すなわち、ループ)と
して機能する(段階400)。当該方法は、段階405
において、ASR240入力チャネルの利用度が所定の
第一(高)閾値、例えば前述された90%、より高いか
否かを決定する。段階405において、ASR240入
力チャネル利用度が当該第一(高)閾値よりも高い場合
には、本方法は高遅延モードを実現し、段階410へ進
む。段階405において、ASR240入力チャネル利
用度が当該第一(高)閾値よりも高くない場合には、本
方法は、段階440において、ASR240入力チャネ
ル利用度が所定の第二(中間)閾値、例えば前述された
83%、より高いか否かを決定する。段階440におい
て、ASR240入力チャネル利用度が当該第二(中
間)閾値よりも高い場合には、本方法は中間遅延モード
を実現し、段階445へ進む。段階440において、A
SR240入力チャネル利用度が当該第二(中間)閾値
よりも高くない場合には、本方法は、段階480におい
て、ASR240入力チャネル利用度が所定の第三
(低)閾値、例えば前述された75%、より高いか否か
を決定する。段階480において、ASR240入力チ
ャネル利用度が当該第三(低)閾値よりも高い場合に
は、本方法は低遅延モードを実現し、段階485へ進
む。段階480において、ASR240入力チャネル利
用度が当該第三(低)閾値よりも高くない場合には、本
方法は、無遅延モード(段階525)に留まり(すなわ
ち戻り)、段階525に引き続いて、本方法はASR2
40入力チャネル利用度のモニターを継続して、段階4
05へ戻る。
【0035】段階405において、ASR240入力チ
ャネル利用度が所定の第一(高)閾値より高い場合に
は、本方法は高遅延モードを実現し、段階410へ進
む。段階410では、本方法は、高遅延モードに関して
第一の遅延タイプ(無音期間)がイネーブルされている
か否か、すなわち、無音期間の持続時間の漸増の利用が
イネーブルされているか否か、を決定し、その場合に
は、本方法は、段階415において、高遅延モードの実
現に際して対応する(高すなわち最長)持続時間を有す
る無音期間を利用する。段階415に引き続いて、ある
いは、段階410で無音期間の持続時間の漸増の利用が
イネーブルされていない場合には、本方法は段階420
へ進み、高遅延モードに関して第二の遅延タイプ(メッ
セージ持続期間)がイネーブルされているか否か、すな
わち、高持続時間(比較的最長)の一連のメッセージあ
るいはプロンプトの利用がイネーブルされているか否
か、を決定する。段階420において、一連の高持続時
間メッセージの利用がイネーブルされている場合には、
本方法は、段階425において、高遅延モードの実現に
際して一連の高持続時間メッセージを利用する。
【0036】段階425に引き続いて、あるいは、段階
420において一連の高持続時間メッセージの利用がイ
ネーブルされていない場合には、本方法は段階430へ
進み、ASR240入力チャネル利用度が(通話が終了
されたために)所定の第四閾値未満に低下したあるいは
低下しているか否かを決定する。望ましい実施例におい
ては、所定の第四閾値は、より短い遅延のモードへ移行
する前にヒステリシス特性を実現する目的で、前記所定
の第一閾値と第二閾値との間のレベルにセットされる。
段階430におけるASR240入力チャネル利用度が
所定の第四閾値未満に低下していない(すなわちより大
きい)場合には、本方法は高遅延モードを維持し(段階
435)、段階430に戻ってASR240入力チャネ
ル利用度のモニターを継続する。段階430におけるA
SR240入力チャネル利用度が所定の第四閾値未満に
低下した(あるいは低下している)場合には、本方法は
段階440へ進み、本方法が中間遅延あるいは低遅延モ
ードへ進むべきか否かを決定する。
【0037】図3において、段階405あるいは430
に引き続いて、段階440においてASR240入力チ
ャネル利用度が所定の第二閾値(中間レベル)よりも大
きい(しかしながら、段階405において、所定の第一
閾値よりは大きくない)場合には、本方法は中間遅延モ
ードを実現し、段階445へ進む。段階445において
は、本方法は、中間遅延モードに対して第一遅延タイプ
(無音期間)がイネーブルされているか否か、すなわ
ち、無音期間増大の利用がイネーブルされているか否
か、を決定し、その場合には、本方法は、段階450に
おける中間遅延モードの実現に際して、無音期間の対応
する(中間的な)持続時間を利用する。段階450に引
き続いて、あるいは、段階445において無音期間増大
の利用がイネーブルされていない場合には、本方法は段
階455へ進み、第二遅延タイプ(メッセージ持続時
間)が中間遅延モードに対してイネーブルされているか
否か、すなわち、一連の中間的な持続時間を有するメッ
セージあるいはプロンプトの利用がイネーブルされてい
るか否か、を決定する。段階455において一連の中間
持続時間メッセージの利用がイネーブルされている場合
には、本方法は、段階460において、中間遅延モード
の実現に際して一連の中間持続時間メッセージを利用す
る。
【0038】段階460に引き続いて、あるいは、段階
455において一連の中間持続時間メッセージの利用が
イネーブルされていない場合には、本方法は段階465
へ進み、ASR240入力チャネル利用度が(通話の終
了に伴って)所定の第五の閾値未満に低下したかあるい
は低下しているか否かを決定する。望ましい実施例にお
いては、望ましい実施例においては、所定の第五閾値
は、低遅延のモードへ移行する前にヒステリシス特性を
実現する目的で、前記所定の第二閾値と第三閾値との間
のレベルにセットされる。段階465におけるASR2
40入力チャネル利用度が所定の第五閾値未満に低下し
た(あるいは低下している)場合には、本方法は段階4
80へ進み、本方法が低遅延モードへ進むべきか否かを
決定する。
【0039】段階465におけるASR240入力チャ
ネル利用度が所定の第五閾値未満に低下していない(す
なわちより大きい)場合には、本方法はASR240入
力チャネル利用度が(通話が着信されたために)所定の
第一閾値より大きい状態に増加したか否かを決定する
(段階470)。段階470においてASR240入力
チャネル利用度が所定の第一閾値より大きい状態に増加
した場合には、本方法は高遅延モードに移行して段階4
10に戻る。段階465におけるASR240入力チャ
ネル利用度が所定の第五閾値未満に低下しておらず(す
なわち第五閾値より大きく)、かつ、所定の第一閾値よ
りも大きくない(段階470)場合には、本方法は中間
遅延モードを維持し(段階475)、段階465へ戻っ
てASR240入力チャネル利用度のモニターを継続す
る。
【0040】段階440あるいは465に引き続いて、
段階480におけるASR240入力チャネル利用度が
所定の第三(低レベル)閾値よりも大きい(しかしなが
ら、段階440における所定の第二閾値よりは大きくな
い)場合には、本方法は低遅延モードを実現し、段階4
85へ進む。段階485では、本方法は、第一遅延タイ
プ(無音期間)が低遅延モードに対してイネーブルされ
ているか否か、すなわち、無音期間増大の利用が医ネー
ル部されているか否かを決定し、その場合には、段階4
90において、低遅延モードの実現に際して対応する
(低すなわち最低)持続時間の無音期間を利用する。段
階490に引き続いて、あるいは、段階485において
無音期間増大の利用がイネーブルされていない場合に
は、本方法は段階495へ進み、低遅延モードに対して
第二遅延タイプ(メッセージ持続時間)がイネーブルさ
れているか否か、すなわち、一連の低持続時間メッセー
ジの利用がイネーブルされているか否かを決定する。段
階495において、一連の低持続時間メッセージの利用
がイネーブルされている場合には、本方法は、段階50
0において、低遅延モードの実現に際して対応する一連
の(低)持続時間メッセージを利用する。
【0041】段階500に引き続いて、あるいは、段階
495において一連の低持続時間メッセージの利用がイ
ネーブルされていない場合には、本方法は段階505へ
進み、ASR240入力チャネル利用度が(通話の終了
に伴って)所定の第六閾値以下に低下したあるいは低下
しているか否かを決定する。望ましい実施例において
は、所定の第六閾値は、無遅延モードへの移行の前にヒ
ステリシス特性を実現する目的で、所定の第三閾値より
も低いレベルに設定される。段階505において、AS
R240入力チャネル利用度が所定の第六閾値未満に低
下した(すなわちより低い)場合には、本方法は段階5
25へ進み、無遅延モードにはいる。
【0042】段階505において、ASR240入力チ
ャネル利用度が所定の第六閾値未満に低下していない
(すなわち、より低くない)場合には、本方法は、AS
R240入力チャネル利用度が(着信通話に伴って)所
定の第一閾値より大きい状態に増加したか否かを決定す
る(段階510)。段階510において、ASR240
入力チャネル利用度が所定の第一閾値よりも大きい状態
に増加した場合には、本方法は高遅延モードに移行し、
段階410へ進む。段階505及び510において、A
SR240入力チャネル利用度が所定の第六閾値未満に
低下しておらず(すなわち、第六閾値よりも大きく)、
かつ、所定の第一閾値を越えるほどには増大していない
場合には、本方法は、さらに、ASR240入力チャネ
ル利用度が所定の第二閾値よりも大きい状態まで増大し
ているか否かを決定する(段階515)。段階515に
おいてASR240入力チャネル利用度が所定の第二閾
値よりも大きい状態まで増大している場合には、本方法
は中間遅延モードに移行し、段階445に進む。ASR
240入力チャネル利用度が所定の第六閾値未満に低下
しておらず(すなわち、より大きく)(段階505)、
かつ、所定の第一閾値あるいは第二閾値を越えるほどに
は増大していない(段階510及び515)場合には、
本方法は低遅延モードに留まり(段階520)、段階5
05へ戻ってASR240入力チャネル利用度のモニタ
ーを継続する。
【0043】図4は、本発明に従って自動音声認識通話
者入力レートを実現する第三の実施例を示す流れ図であ
る。前述されているように、この実施例の遅延モード
は、各通話が着信する際に通話毎に実装される。プロセ
スとして連続的に実行されている場合と異なり、この第
三の方法は、段階600で、ネットワークインターフェ
ース160による通話の着信から開始される。その後、
本方法は、段階605において、ASR240入力チャ
ネルの現在の利用度を決定する。ASR240入力チャ
ネル利用度が第一閾値より高い場合には(段階61
0)、遅延モードがセットされる(段階615)。次い
で、本方法は、メッセージ出力に係るメッセージ持続時
間及び/あるいは無音期間持続時間の決定など、着信通
話に関する遅延パラメータを決定し(段階620)、通
話に係るその他の処理を継続する(段階640)。
【0044】段階610におけるASR240入力チャ
ネル利用度が第一閾値より大きくない場合には、無遅延
モードへ戻る前にヒステリシス特性を実現する目的で、
本方法はASR240入力チャネル利用度が第二閾値よ
りも高いか否かを決定する(段階625)。段階625
において、ASR240入力チャネル利用度が第二閾値
よりも高い場合には、本方法は遅延モードが設定されて
いるか否か、すなわち、遅延モードが以前の通話に関し
て設定されていた(利用度が以前は第一閾値よりも高か
ったことを意味する)か否かを決定する(段階63
0)。遅延モードが設定されていた場合には(段階63
0)、本方法は段階620へ進み、前述されているよう
に、当該着信通話に係る遅延パラメータを決定する。遅
延モードが設定されていなかった場合には(段階63
0)、以前の全ての遅延モードがクリアされていること
(あるいは、全く設定されていなかったこと)を意味し
ており、本方法は段階640へ進んで、通話に係る他の
処理を継続する。段階625において、ASR240入
力チャネル利用度が第二閾値を越えない場合には、本方
法は遅延モードをクリア、すなわち、以前に設定されて
いたあらゆる遅延モードをリセットする(段階63
5)。段階635に引き続いて、本方法は、通話に係る
他の処理を継続する。
【0045】以上に記載されたように、本発明の望まし
い実施例は、自動音声認識を有するインタラクティブ通
信システム向けの通話者入力レート制御を実現する。こ
こで、当該インタラクティブ通信システムは複数個の入
力チャネル及び複数個の出力チャネルを有し、複数個の
ASR入力チャネルを有する自動音声認識コンポーネン
トを有している。本発明に従った方法は、まず、複数個
のASR入力チャネルの利用度を決定する段階、次い
で、複数個のASR入力チャネルの利用度が第一の所定
の閾値より大きい場合に、複数個の出力チャネルのうち
の単一あるいは複数の出力チャネルに係るメッセージ出
力に関連する遅延モードを実現する段階、を有してい
る。
【0046】追加的なコンセントレータ機能は、モニタ
ーされたエネルギーレベルを生成する目的で(複数個の
入力チャネルのうちの)入力チャネルのエネルギーレベ
ルをモニターする段階;バッファされた情報を形成する
目的で、以前の時間期間における入力チャネルから受信
された全ての(エコー打ち消し済みの)入力をメモリバ
ッファにストアする段階;及び、モニターされたエネル
ギーレベルが所定のエネルギーレベルよりも大きい場合
に、バッファされた情報を複数個のASR入力チャネル
のうちのASR入力チャネルに送出し、入力チャネルを
ASR入力チャネルに接続する段階、を有している。
【0047】種々の関連する遅延モードは、出力チャネ
ル上のメッセージ出力に関して、複数のメッセージ持続
時間のうちからあるメッセージ持続時間を、及び、複数
個の無音期間持続時間のうちからある無音期間持続時間
を、それぞれ独立に、あるいは個別にもしくは組み合わ
せて選択することによって決定される。望ましい実施例
においては、種々の関連する遅延モードは、複数個のA
SR入力チャネルの利用度に比例し、あるいは、複数個
のASR入力チャネルの利用度の範囲に対応する。
【0048】本発明の数々の利点は以上の議論より明ら
かである。第一に、利用者は、全てのASR入力チャネ
ルが他の利用者へのサービス提供に関してビジー状態で
ある場合においても、保留されたり切断されたりするこ
となく、実際にインタラクティブシステムによってサー
ビスを提供される。第二に、本発明の種々の実施例は、
与えられたすなわち固定された個数のASR入力チャネ
ルを増加させることを要求せずにASRシステム容量を
増大させ、既存のASR入力チャネルのより効率的な利
用を実現する。加えて、ASR入力チャネルをより効率
的に利用することによって、実際の通話者待機時間が減
少し、より長い持続時間を有するプロンプトあるいはメ
ッセージによって通話者にサービスを提供し続けること
によって、見かけの待機時間も減少する。最後に、本発
明によって実現された容量の増大はユーザに対して透過
的であり、ユーザフレンドリーであり、混雑すなわち過
負荷状況においても利用者には実効的に気付かれず、既
存の自動音声認識システムにおいてコスト効率良く実装
されることが可能である。
【0049】以上の説明は、本発明の一実施例に関する
もので,この技術分野の当業者であれば、本発明の種々
の変形例が考え得るが、それらはいずれも本発明の技術
的範囲に包含される。
【0050】
【発明の効果】以上述べたごとく、本発明によれば、自
動音声認識システムの容量を増大させる通話者入力レー
ト制御方法、通話者入力レート制御システム、及び、通
話者入力レート制御装置が提供される。
【0051】特許請求の範囲に発明の構成要件の後の括
弧内の符号が記載されている場合は、構成要件と実施例
と対応づけて発明を容易に理解させる為であり、特許請
求の範囲の解釈に用いるべきのものではない。
【図面の簡単な説明】
【図1】 本発明に従って自動音声認識通話者入力レー
ト制御を実現するシステム及び装置を示すブロック図。
【図2】 本発明に従って自動音声認識通話者入力レー
ト制御を実現する第一の方法を例示する流れ図。
【図3】 本発明に従って自動音声認識通話者入力レー
ト制御を実現する第二の方法を例示する流れ図。
【図4】 本発明に従って自動音声認識通話者入力レー
ト制御を実現する第三の方法を例示する流れ図。
【符号の説明】
100 自動音声認識システム 110 ネットワーク 115 交換センター 120 ルータ 125 サーバ 130 モバイル局 135 基地局 140 電話機 145 コンピュータ 160 ネットワークインターフェース 165 バス 200 通話者入力レート制御装置 210 プロセッサ 215 バス 220 メモリ 225 バス 230 オブザーバモジュール 235 バス 240 自動音声認識システム 245 通話制御モジュール 250 出力モジュール 255 メッセージ選択モジュール 260 メッセージメモリ 300 遅延モード処理 305 ASR入力チャネルの利用度を決定 310 ASR入力チャネルの利用度が所定の第一閾値
より高いか? 315 ASR入力チャネルの利用度に比例した関連す
る遅延モードを実現 320 ASR入力チャネルの利用度を決定 325 ASR入力チャネルの利用度が所定の第二閾値
より低いか? 330 無遅延モードに戻る 400 遅延モード処理 405 ASR入力チャネルの利用度が第一(高)閾値
より高いか? 410 高レベル無音期間がイネーブルされているか? 415 高レベル無音期間を利用 420 高レベルメッセージ持続時間がイネーブルされ
ているか? 425 高レベルメッセージ持続時間を利用 430 ASR入力チャネルの利用度が第四閾値未満か
? 435 高遅延モードを維持 440 ASR入力チャネルの利用度が第二(中間)閾
値より高いか? 445 中間レベル無音期間がイネーブルされているか
? 450 中間レベル無音期間を利用 455 中間レベルメッセージ持続時間がイネーブルさ
れているか? 460 中間レベルメッセージ持続時間を利用 465 ASR入力チャネルの利用度が第五閾値未満か
? 470 ASR入力チャネルの利用度が第一閾値より高
いか? 475 中間遅延モードを維持 480 ASR入力チャネルの利用度が第三(低)閾値
より高いか? 485 低レベル無音期間がイネーブルされているか? 490 低レベル無音期間を利用 495 低レベルメッセージ持続時間がイネーブルされ
ているか? 500 低レベルメッセージ持続時間を利用 505 ASR入力チャネルの利用度が第六閾値未満か
? 510 ASR入力チャネルの利用度が第一閾値より高
いか? 515 ASR入力チャネルの利用度が第二閾値より高
いか? 520 低遅延モードを維持 525 無遅延モードを維持(あるいは無遅延モードに
戻る) 600 開始: 着信 605 ASR入力チャネルの現在の利用度を決定 610 ASR入力チャネルの利用度が第一閾値より高
いか? 615 遅延モードをセット 620 着信通話に係る遅延パラメータを決定 625 ASR入力チャネルの利用度が第二閾値より高
いか? 630 遅延モードがセットされているか? 635 遅延モードをクリア 640 通話処理を継続
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04M 3/42 G10L 3/00 571T (71)出願人 596077259 600 Mountain Avenue, Murray Hill, New Je rsey 07974−0636U.S.A.

Claims (53)

    【特許請求の範囲】
  1. 【請求項1】 自動音声認識を有するインタラクティブ
    通信システムにおける通話者入力レート制御方法におい
    て、前記インタラクティブ通信システムは複数個の入力
    チャネル及び複数個の出力チャネルを有し、かつ、前記
    インタラクティブ通信システムは複数個の自動音声認識
    入力チャネルを有しており、当該方法が、 前記複数個の自動音声認識入力チャネルの利用度を決定
    する段階と、 前記複数個の自動音声認識入力チャネルの前記利用度が
    所定の第一閾値よりも大きい場合に、前記複数個の出力
    チャネルの出力チャネルに係るメッセージ出力に対して
    関連する遅延モードを実現する段階とを有することを特
    徴とする通話者入力レート制御方法。
  2. 【請求項2】 前記方法が、さらに、前記複数個の出力
    チャネルに係る複数個のメッセージ出力に対して前記関
    連する遅延モードを実現する段階を有することを特徴と
    する請求項1に記載の通話者入力レート制御方法。
  3. 【請求項3】 前記出力チャネルが前記複数個の入力チ
    ャネルのうちの現時点で着信された通話に係る入力チャ
    ネルに対応することを特徴とする請求項1に記載の通話
    者入力レート制御方法。
  4. 【請求項4】 前記方法が、さらに、モニターされたエ
    ネルギーレベルを生成する目的で前記複数個の入力チャ
    ネルのうちの入力チャネルのエネルギーレベルをモニタ
    ーする段階と、バッファされた情報を構成する目的で以
    前の時間期間に亘る入力チャネルから着信されたエコー
    キャンセル済み入力全てよりなる複数個のサンプルをメ
    モリバッファにストアする段階と、前記モニターされた
    エネルギーレベルが所定のエネルギーレベルより大きい
    場合に、前記バッファされた情報を前記複数個の自動音
    声認識入力チャネルのうちの自動音声認識入力チャネル
    に送出し、前記入力チャネルを前記自動音声認識入力チ
    ャネルに接続する段階とを有することを特徴とする請求
    項1に記載の通話者入力レート制御方法。
  5. 【請求項5】 前記関連する遅延モードが、前記出力チ
    ャネルに係る前記メッセージ出力に対して、複数個のメ
    ッセージ持続時間のうちからあるメッセージ持続時間
    を、及び、複数個の無音期間持続時間のうちからある無
    音期間持続時間を、個々にあるいは組み合わせで独立に
    選択することによって決定されることを特徴とする請求
    項1に記載の通話者入力レート制御方法。
  6. 【請求項6】 前記関連する遅延モードが、前記複数個
    の自動音声認識入力チャネルの前記利用度に比例するこ
    とを特徴とする請求項1に記載の通話者入力レート制御
    方法。
  7. 【請求項7】 前記関連する遅延モードが、複数個の漸
    増的遅延モードから選択された漸増的遅延モードである
    ことを特徴とする請求項1に記載の通話者入力レート制
    御方法。
  8. 【請求項8】 前記関連する遅延モードは複数個の関連
    する遅延モードから選択され、前記出力チャネルに係る
    出力に対する前記複数個の関連する遅延モードが対応す
    る複数個の一連のメッセージを有し、ここで、前記対応
    する複数個の一連のメッセージは第一の一連のメッセー
    ジ及び第二の一連のメッセージを含んでおり、前記第一
    の一連のメッセージが前記第二の一連のメッセージと比
    較してより大きい漸増的遅延を有している、すなわち、
    前記第一の一連のメッセージのうちの各々のメッセージ
    が前記第二の一連のメッセージのうちの各々対応するも
    のよりも長い持続時間を有していることを特徴とする請
    求項1に記載の通話者入力レート制御方法。
  9. 【請求項9】 前記複数個の関連する遅延モードが複数
    個の無音期間の利用を含み、 ここで、前記複数個の無音期間は相異なった持続時間を
    有する対応する無音期間を含んでいることを特徴とする
    請求項8に記載の通話者入力レート制御方法。
  10. 【請求項10】 前記複数個の関連する遅延モードが、
    前記出力チャネルに係る前記メッセージの前記出力以前
    に前記複数個の無音期間から選択された無音期間の利用
    を含むことを特徴とする請求項9に記載の通話者入力レ
    ート制御方法。
  11. 【請求項11】 前記複数個の関連する遅延モードが、
    前記複数個の無音期間から選択され、前記出力チャネル
    に係る前記メッセージの前記出力の間に挿入される無音
    期間の利用を含むことを特徴とする請求項9に記載の通
    話者入力レート制御方法。
  12. 【請求項12】 前記関連する遅延モードが複数個の関
    連する遅延モードから選択され、前記複数個の関連する
    遅延モードの各々が前記複数個の自動音声認識入力チャ
    ネルの利用度の所定の範囲に対応することを特徴とする
    請求項1に記載の通話者入力レート制御方法。
  13. 【請求項13】 前記関連する遅延モードが、前記出力
    チャネルに係る前記メッセージ出力における無音期間の
    利用を含むことを特徴とする請求項1に記載の通話者入
    力レート制御方法。
  14. 【請求項14】 前記関連する遅延モードが、前記出力
    チャネルに係る前記メッセージ出力の持続時間の増大を
    含むことを特徴とする請求項1に記載の通話者入力レー
    ト制御方法。
  15. 【請求項15】 前記方法が、さらに、前記複数個の自
    動音声認識入力チャネルの前記利用度が所定の第二閾値
    未満である場合に、前記出力チャネルに係る前記メッセ
    ージ出力に関して無遅延モードを実現する段階を有する
    ことを特徴とする請求項1に記載の通話者入力レート制
    御方法。
  16. 【請求項16】 前記所定の第一閾値が前記所定の第二
    閾値より大きいことを特徴とする請求項15に記載の通
    話者入力レート制御方法。
  17. 【請求項17】 自動音声認識向けの通話者入力レート
    制御を有するインタラクティブ通信システムにおいて、
    当該システムが、 複数個の入力チャネル及び複数個の出力チャネルを有す
    るネットワークインターフェースと、 前記複数個の出力チャネルに係るメッセージ出力を行な
    う出力モジュールと、 複数個の自動音声認識入力チャネルを有する自動音声認
    識モジュールと、 前記複数個の入力チャネル、前記出力モジュール及び前
    記自動音声認識入力チャネルに接続された通話者入力レ
    ート制御モジュールとを有し、 ここで、当該通話者入力レート制御モジュールは、前記
    複数個の自動音声認識入力チャネルの利用度を決定する
    命令を有しており、前記複数個の自動音声認識入力チャ
    ネルの前記利用度が所定の第一閾値より大きい場合に、
    前記出力モジュールに、前記複数個の出力チャネルのう
    ちの出力チャネルに係るメッセージ出力に関連する遅延
    モードを実現させる命令を有していることを特徴とする
    通話者入力レート制御システム。
  18. 【請求項18】 前記通話者入力レート制御モジュール
    が、さらに、前記複数個の出力チャネルに係る複数個の
    メッセージ出力に対して前記関連する遅延モードを実現
    するよう前記出力モジュールに指示する命令を有するこ
    とを特徴とする請求項17に記載の通話者入力レート制
    御システム。
  19. 【請求項19】 前記出力チャネルが前記複数個の入力
    チャネルのうちの現時点で着信された通話に係る入力チ
    ャネルに対応することを特徴とする請求項17に記載の
    通話者入力レート制御システム。
  20. 【請求項20】 前記通話者入力レート制御モジュール
    が、さらに、 モニターされたエネルギーレベルを生成する目的で前記
    複数個の入力チャネルのうちの入力チャネルのエネルギ
    ーレベルをモニターさせる命令と、 バッファされた情報を構成する目的で以前の時間期間に
    亘る入力チャネルから着信されたエコーキャンセル済み
    入力全てよりなる複数個のサンプルをメモリバッファに
    ストアさせる命令と、 前記モニターされたエネルギーレベルが所定のエネルギ
    ーレベルより大きい場合に、前記バッファされた情報を
    前記複数個の自動音声認識入力チャネルのうちの自動音
    声認識入力チャネルに送出し、前記入力チャネルを前記
    自動音声認識入力チャネルに接続させる命令とを有する
    ことを特徴とする請求項17に記載の通話者入力レート
    制御システム。
  21. 【請求項21】 前記通話者入力レート制御モジュール
    が、さらに、前記出力チャネルに係る前記メッセージ出
    力に対して、複数個のメッセージ持続時間のうちからあ
    るメッセージ持続時間を、及び、複数個の無音期間持続
    時間のうちからある無音期間持続時間を、個々にあるい
    は組み合わせで独立に選択することによって前記関連す
    る遅延モードを決定させる命令を有することを特徴とす
    る請求項17に記載の通話者入力レート制御システム。
  22. 【請求項22】 前記通話者入力レート制御モジュール
    が、さらに、前記複数個の自動音声認識入力チャネルの
    前記利用度に比例するように前記関連する遅延モードを
    決定させる命令を有することを特徴とする請求項17に
    記載の通話者入力レート制御システム。
  23. 【請求項23】 前記通話者入力レート制御モジュール
    が、さらに、複数個の漸増的遅延モードから選択された
    漸増的遅延モードとして前記関連する遅延モードを決定
    させる命令を有することを特徴とする請求項17に記載
    の通話者入力レート制御システム。
  24. 【請求項24】 前記通話者入力レート制御モジュール
    が、さらに、前記複数個の関連する遅延モードから前記
    関連する遅延モードを選択させる命令を有しており、前
    記出力チャネルに係る出力に対する前記複数個の関連す
    る遅延モードが対応する複数個の一連のメッセージを有
    しており、前記対応する複数個の一連のメッセージは第
    一の一連のメッセージ及び第二の一連のメッセージを含
    んでおり、前記第一の一連のメッセージが前記第二の一
    連のメッセージと比較してより大きい漸増的遅延を有し
    ている、すなわち、前記第一の一連のメッセージのうち
    の各々のメッセージが前記第二の一連のメッセージのう
    ちの各々対応するものよりも長い持続時間を有している
    ことを特徴とする請求項17に記載の通話者入力レート
    制御システム。
  25. 【請求項25】 前記複数個の関連する遅延モードが複
    数個の無音期間の利用を含み、 ここで、前記複数個の無音期間は相異なった持続時間を
    有する対応する無音期間を含んでいることを特徴とする
    請求項24に記載の通話者入力レート制御システム。
  26. 【請求項26】 前記通話者入力レート制御モジュール
    が、さらに、前記出力モジュールに対して、前記出力チ
    ャネルに係る前記メッセージの前記出力以前に前記複数
    個の無音期間から選択された無音期間を出力させるよう
    に指示する命令を有することを特徴とする請求項25に
    記載の通話者入力レート制御システム。
  27. 【請求項27】 前記通話者入力レート制御モジュール
    が、さらに、前記出力モジュールに対して、前記出力チ
    ャネルに係る前記メッセージの前記出力の間に、前記複
    数個の無音期間から選択された無音期間を挿入させるよ
    うに指示する命令を有することを特徴とする請求項25
    に記載の通話者入力レート制御システム。
  28. 【請求項28】 前記通話者入力レート制御モジュール
    が、さらに、複数個の関連する遅延モードから前記関連
    する遅延モードを選択する命令を有しており、 前記複数個の関連する遅延モードの各々が前記複数個の
    自動音声認識入力チャネルの利用度の所定の範囲に対応
    することを特徴とする請求項17に記載の通話者入力レ
    ート制御システム。
  29. 【請求項29】 前記通話者入力レート制御モジュール
    が、さらに、前記出力チャネルに係る前記メッセージ出
    力に対する前記関連する遅延モードにおいて無音期間の
    利用を含ませるように前記出力モジュールに指示する命
    令を有することを特徴とする請求項17に記載の通話者
    入力レート制御システム。
  30. 【請求項30】 前記通話者入力レート制御モジュール
    が、さらに、前記出力チャネルに係る前記メッセージ出
    力に対する前記関連する遅延モードにおいて持続時間の
    増大を含ませるように前記出力モジュールに指示する命
    令を有することを特徴とする請求項17に記載の通話者
    入力レート制御システム。
  31. 【請求項31】 前記通話者入力レート制御モジュール
    が、さらに、前記複数個の自動音声認識入力チャネルの
    前記利用度が所定の第二閾値未満である場合に、前記出
    力チャネルに係る前記メッセージ出力に関して無遅延モ
    ードを実現させるように前記出力モジュールに指示する
    命令を有することを特徴とする請求項17に記載の通話
    者入力レート制御システム。
  32. 【請求項32】 前記所定の第一閾値が前記所定の第二
    閾値より大きいことを特徴とする請求項31に記載の通
    話者入力レート制御システム。
  33. 【請求項33】 前記システムが、さらに、前記出力モ
    ジュール及び前記自動音声認識モジュールに接続された
    通話制御モジュールを有しここで、当該通話制御モジュ
    ールは、前記音声認識モジュールからの認識された音声
    に応答してメッセージ内容を決定するように機能するこ
    とを特徴とする請求項第17項に記載の通話者入力レー
    ト制御システム。
  34. 【請求項34】 自動音声認識を有するインタラクティ
    ブ通信システムにおける通話者入力レート制御を実現す
    る装置において、 前記インタラクティブ通信システムは、 複数個の入力チャネル及び複数個の出力チャネルと、 複数個の自動音声認識入力チャネルを有する自動音声認
    識コンポーネントと、前記複数個の出力チャネル上のメ
    ッセージ出力に係る出力モジュールとを有しており、前
    記装置は、前記入力チャネルと、前記出力モジュール及
    び前記自動音声認識入力チャネルに接続可能であり、前
    記装置が、 前記複数個の入力チャネルに接続可能なオブザーバモジ
    ュールと、 前記オブザーバモジュールに接続されており前記複数個
    の自動音声認識入力チャネルに接続可能なメモリと、 前記オブザーバモジュール及び前記メモリに接続された
    プロセッサとを有し、 ここで、当該プロセッサは、前記出力モジュール及び前
    記複数個の自動音声認識入力チャネルに対してさらに接
    続可能であり、当該プロセッサは前記複数個の自動音声
    認識入力チャネルの利用度を決定する命令を有してお
    り、前記複数個の自動音声認識入力チャネルの前記利用
    度が所定の第一閾値より大きい場合に、前記出力モジュ
    ールに、前記複数個の出力チャネルのうちの出力チャネ
    ルに係るメッセージ出力に関連する遅延モードを実現さ
    せる命令を有していることを特徴とする通話者入力レー
    ト制御装置。
  35. 【請求項35】 前記プロセッサが、さらに、前記複数
    個の出力チャネルに係る複数個のメッセージ出力に対し
    て前記関連する遅延モードを実現するよう前記出力モジ
    ュールに指示する命令を有することを特徴とする請求項
    34に記載の通話者入力レート制御装置。
  36. 【請求項36】 前記出力チャネルが前記複数個の入力
    チャネルのうちの現時点で着信された通話に係る入力チ
    ャネルに対応することを特徴とする請求項34に記載の
    通話者入力レート制御装置。
  37. 【請求項37】 前記メモリが、バッファされた情報を
    構成する目的で以前の時間期間に亘る入力チャネルから
    着信されたエコーキャンセル済み入力全てよりなる複数
    個のサンプルをストアし、及び、前記オブザーバモジュ
    ールが、モニターされたエネルギーレベルを生成する目
    的で前記入力チャネルのエネルギーレベルをモニター
    し、かつ、前記モニターされたエネルギーレベルが所定
    のエネルギーレベルより大きい場合に、前記バッファさ
    れた情報を前記複数個の自動音声認識入力チャネルのう
    ちの自動音声認識入力チャネルに送出して前記入力チャ
    ネルを前記自動音声認識入力チャネルに接続させること
    を特徴とする請求項34に記載の通話者入力レート制御
    装置。
  38. 【請求項38】 前記プロセッサが、さらに、前記出力
    チャネルに係る前記メッセージ出力に対して、複数個の
    メッセージ持続時間のうちからあるメッセージ持続時間
    を、及び、複数個の無音期間持続時間のうちからある無
    音期間持続時間を、個々にあるいは組み合わせで独立に
    選択することによって前記関連する遅延モードを決定さ
    せる命令を有することを特徴とする請求項34に記載の
    通話者入力レート制御装置。
  39. 【請求項39】 前記プロセッサが、さらに、前記複数
    個の自動音声認識入力チャネルの前記利用度に比例する
    ように前記関連する遅延モードを決定させる命令を有す
    ることを特徴とする請求項34に記載の通話者入力レー
    ト制御装置。
  40. 【請求項40】 前記プロセッサが、さらに、複数個の
    漸増的遅延モードから選択された漸増的遅延モードとし
    て前記関連する遅延モードを決定させる命令を有するこ
    とを特徴とする請求項34に記載の通話者入力レート制
    御装置。
  41. 【請求項41】 前記プロセッサが、さらに、前記複数
    個の関連する遅延モードから前記関連する遅延モードを
    選択させる命令を有しており、前記出力チャネルに係る
    出力に対する前記複数個の関連する遅延モードが対応す
    る複数個の一連のメッセージを有しており、前記対応す
    る複数個の一連のメッセージは第一の一連のメッセージ
    及び第二の一連のメッセージを含んでおり、前記第一の
    一連のメッセージが前記第二の一連のメッセージと比較
    してより大きい漸増的遅延を有している、すなわち、前
    記第一の一連のメッセージのうちの各々のメッセージが
    前記第二の一連のメッセージのうちの各々対応するもの
    よりも長い持続時間を有していることを特徴とする請求
    項34に記載の通話者入力レート制御装置。
  42. 【請求項42】 前記複数個の関連する遅延モードが複
    数個の無音期間の利用を含み、 ここで、前記複数個の無音期間は相異なった持続時間を
    有する対応する無音期間を含んでいることを特徴とする
    請求項41に記載の通話者入力レート制御装置。
  43. 【請求項43】 前記プロセッサが、さらに、前記出力
    モジュールに対して、前記出力チャネルに係る前記メッ
    セージの前記出力以前に前記複数個の無音期間から選択
    された無音期間を出力させるように指示する命令を有す
    ることを特徴とする請求項42に記載の通話者入力レー
    ト制御装置。
  44. 【請求項44】 前記プロセッサが、さらに、前記出力
    モジュールに対して、前記出力チャネルに係る前記メッ
    セージの前記出力の間に、前記複数個の無音期間から選
    択された無音期間を挿入させるように指示する命令を有
    することを特徴とする請求項42に記載の通話者入力レ
    ート制御装置。
  45. 【請求項45】 前記プロセッサが、さらに、複数個の
    関連する遅延モードから前記関連する遅延モードを選択
    する命令を有しており、 前記複数個の関連する遅延モードの各々が前記複数個の
    自動音声認識入力チャネルの利用度の所定の範囲に対応
    することを特徴とする請求項34に記載の通話者入力レ
    ート制御装置。
  46. 【請求項46】 前記プロセッサが、さらに、前記出力
    チャネルに係る前記メッセージ出力に対する前記関連す
    る遅延モードにおいて無音期間の利用を含ませるように
    前記出力モジュールに指示する命令を有することを特徴
    とする請求項34に記載の通話者入力レート制御装置。
  47. 【請求項47】 前記プロセッサが、さらに、前記出力
    チャネルに係る前記メッセージ出力に対する前記関連す
    る遅延モードにおいて持続時間の増大を含ませるように
    前記出力モジュールに指示する命令を有することを特徴
    とする請求項34に記載の通話者入力レート制御装置。
  48. 【請求項48】 前記プロセッサが、さらに、前記複数
    個の自動音声認識入力チャネルの前記利用度が所定の第
    二閾値未満である場合に、前記出力チャネルに係る前記
    メッセージ出力に関して無遅延モードを実現させるよう
    に前記出力モジュールに指示する命令を有することを特
    徴とする請求項34に記載の通話者入力レート制御装
    置。
  49. 【請求項49】 前記所定の第一閾値が前記所定の第二
    閾値より大きいことを特徴とする請求項48に記載の通
    話者入力レート制御装置。
  50. 【請求項50】 前記装置が前記インタラクティブ通信
    システム内に実現されることを特徴とする通話者入力レ
    ート制御装置。
  51. 【請求項51】 自動音声認識を有するインタラクティ
    ブ通信システムにおける通話者入力レート制御を実現す
    る装置において、前記インタラクティブ通信システム
    は、 複数個の入力チャネル及び複数個の出力チャネルと、 複数個の自動音声認識入力チャネルを有する自動音声認
    識コンポーネントと、 前記複数個の出力チャネル上のメッセージ出力に係る出
    力モジュールと、を有しており、前記装置は、 前記複数個の入力チャネルに接続可能なオブザーバモジ
    ュールと、 ここで、当該オブザーバモジュールは、モニターされた
    エネルギーレベルを生成する目的で前記複数個の入力チ
    ャネルのうちの入力チャネルのエコー打ち消しを実現し
    てエネルギーレベルをモニターし、前記モニターされた
    エネルギーレベルが所定のエネルギーレベルより大きい
    場合に前記入力チャネルを前記自動音声認識入力チャネ
    ルのうちの自動音声認識入力チャネルに接続するように
    機能し、前記オブザーバモジュールに接続されており前
    記複数個の自動音声認識入力チャネルに接続可能なメモ
    リと、 ここで、当該メモリは、バッファされた情報を構成する
    目的で以前の時間期間に亘る入力チャネルから着信され
    たエコーキャンセル済み入力全てよりなる複数個のサン
    プルをストアし、かつ、前記バッファされた情報を前記
    自動音声認識入力チャネルに送出するように機能し、 前記オブザーバモジュール及び前記メモリに接続された
    プロセッサと、 ここで、当該プロセッサは、前記出力モジュール及び前
    記複数個の自動音声認識入力チャネルに対してさらに接
    続可能であり、前記複数個の自動音声認識入力チャネル
    の利用度を決定する命令を有しており、前記複数個の自
    動音声認識入力チャネルの前記利用度が所定の第一閾値
    より大きい場合に、前記出力モジュールに、前記複数個
    の出力チャネルのうちの出力チャネルに係る複数個のメ
    ッセージ出力に関連する遅延モードを実現させる命令を
    有し、及び、前記プロセッサは、さらに、前記複数個の
    自動音声認識入力チャネルの前記利用度が所定の第二閾
    値より低い場合に、前記出力モジュールに、前記複数個
    の出力チャネルのうちの出力チャネルに係る前記複数個
    のメッセージ出力に無遅延モードを実現させる命令を有
    していることを特徴とする通話者入力レート制御装置。
  52. 【請求項52】 前記プロセッサが、さらに、前記出力
    チャネルに係る前記複数個のメッセージ出力に対して、
    複数個のメッセージ持続時間のうちからあるメッセージ
    持続時間を、及び、複数個の無音期間持続時間のうちか
    らある無音期間持続時間を、個々にあるいは組み合わせ
    で独立に選択することによって前記関連する遅延モード
    を決定させる命令を有することを特徴とする請求項51
    に記載の通話者入力レート制御装置。
  53. 【請求項53】 前記プロセッサが、さらに、前記複数
    個の関連する遅延モードから前記関連する遅延モードを
    選択させる命令を有し、 前記複数個の関連する遅延モードが、前記複数個の自動
    音声認識入力チャネルの前記利用度に比例する複数個の
    連続的な遅延モード及び前記複数個の自動音声認識入力
    チャネルの前記利用度の対応する範囲に比例する複数個
    の漸増的遅延モードを有しており、 前記複数個の連続的遅延モード及び前記複数個の漸増的
    遅延モードが、可変持続時間を有する複数個の無音期間
    及び可変持続時間を有する複数個の一連のメッセージか
    ら個別にあるいは組み合わせて選択されたものから構成
    されていることを特徴とする請求項51に記載の通話者
    入力レート制御装置。
JP2001092258A 2000-03-29 2001-03-28 通話者入力レート制御方法、通話者入力レート制御システム、及び通話者入力レート制御装置 Expired - Fee Related JP5051945B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/537,330 US6728671B1 (en) 2000-03-29 2000-03-29 Automatic speech recognition caller input rate control
US09/537330 2000-03-29

Publications (3)

Publication Number Publication Date
JP2001320490A true JP2001320490A (ja) 2001-11-16
JP2001320490A5 JP2001320490A5 (ja) 2008-05-15
JP5051945B2 JP5051945B2 (ja) 2012-10-17

Family

ID=24142191

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001092258A Expired - Fee Related JP5051945B2 (ja) 2000-03-29 2001-03-28 通話者入力レート制御方法、通話者入力レート制御システム、及び通話者入力レート制御装置

Country Status (6)

Country Link
US (1) US6728671B1 (ja)
EP (1) EP1139334B1 (ja)
JP (1) JP5051945B2 (ja)
CA (1) CA2337368C (ja)
DE (1) DE60123696T2 (ja)
MX (1) MXPA01003126A (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7917364B2 (en) * 2003-09-23 2011-03-29 Hewlett-Packard Development Company, L.P. System and method using multiple automated speech recognition engines
US7386443B1 (en) 2004-01-09 2008-06-10 At&T Corp. System and method for mobile automatic speech recognition
US20050177371A1 (en) * 2004-02-06 2005-08-11 Sherif Yacoub Automated speech recognition
FR2881867A1 (fr) * 2005-02-04 2006-08-11 France Telecom Procede de transmission de marques de fin de parole dans un systeme de reconnaissance de la parole
US20060258308A1 (en) * 2005-05-10 2006-11-16 Fassbender Charles J Electronic device for interleaving program segments and skipping program breaks from two radio/TV broadcasts
US8433041B2 (en) * 2005-09-23 2013-04-30 Bce Inc. Method and system to enable touch-free incoming call handling and touch-free outgoing call origination
WO2007033459A1 (en) * 2005-09-23 2007-03-29 Bce Inc. Method and system to enable touch-free incoming call handling and touch-free outgoing call origination
WO2007033458A1 (en) * 2005-09-23 2007-03-29 Bce Inc. Methods and systems for touch-free call handling
CA2571009C (en) * 2005-09-23 2010-10-05 Bce Inc. Methods and systems for touch-free call origination
US8036373B2 (en) * 2006-03-07 2011-10-11 Cisco Technology, Inc. Methods and systems for providing dynamic message content to callers on hold
US8139755B2 (en) 2007-03-27 2012-03-20 Convergys Cmg Utah, Inc. System and method for the automatic selection of interfaces
US8548812B2 (en) * 2008-12-22 2013-10-01 Avaya Inc. Method and system for detecting a relevant utterance in a voice session
CN110400576B (zh) * 2019-07-29 2021-10-15 北京声智科技有限公司 语音请求的处理方法及装置
US11626105B1 (en) * 2019-12-10 2023-04-11 Amazon Technologies, Inc. Natural language processing

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58131856A (ja) * 1982-02-01 1983-08-05 Nippon Telegr & Teleph Corp <Ntt> 音声応答認識サ−ビス方式
JPS6348946A (ja) * 1986-08-18 1988-03-01 Nippon Telegr & Teleph Corp <Ntt> 音声認識処理方式
JPH098708A (ja) * 1995-04-07 1997-01-10 Texas Instr Inc <Ti> 音声作動プロンプト・インタラプト機能を備えたプロンプト・インタラプト・システム及び調整可能にエコーを打ち消す方法
JPH10313365A (ja) * 1997-05-13 1998-11-24 N T T Ido Tsushinmo Kk 交換機および音声ガイダンス報知システム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4914692A (en) * 1987-12-29 1990-04-03 At&T Bell Laboratories Automatic speech recognition using echo cancellation
JPH04119042A (ja) * 1990-09-10 1992-04-20 Fujitsu Ltd Isdnのdチャンネル輻輳制御方式
US5311574A (en) * 1991-10-23 1994-05-10 At&T Bell Laboratories Automatic customer call back for automatic call distribution systems
JPH0792993A (ja) * 1993-09-20 1995-04-07 Fujitsu Ltd 音声認識装置
US5537395A (en) * 1995-04-13 1996-07-16 Northern Telecom Limited Method and apparatus for setting a channel congestion message in a wireless multiple access packet data system
GB2325110B (en) * 1997-05-06 2002-10-16 Ibm Voice processing system
US5970446A (en) * 1997-11-25 1999-10-19 At&T Corp Selective noise/channel/coding models and recognizers for automatic speech recognition

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58131856A (ja) * 1982-02-01 1983-08-05 Nippon Telegr & Teleph Corp <Ntt> 音声応答認識サ−ビス方式
JPS6348946A (ja) * 1986-08-18 1988-03-01 Nippon Telegr & Teleph Corp <Ntt> 音声認識処理方式
JPH098708A (ja) * 1995-04-07 1997-01-10 Texas Instr Inc <Ti> 音声作動プロンプト・インタラプト機能を備えたプロンプト・インタラプト・システム及び調整可能にエコーを打ち消す方法
JPH10313365A (ja) * 1997-05-13 1998-11-24 N T T Ido Tsushinmo Kk 交換機および音声ガイダンス報知システム

Also Published As

Publication number Publication date
US6728671B1 (en) 2004-04-27
JP5051945B2 (ja) 2012-10-17
MXPA01003126A (es) 2005-08-26
EP1139334A2 (en) 2001-10-04
EP1139334B1 (en) 2006-10-11
DE60123696D1 (de) 2006-11-23
DE60123696T2 (de) 2007-08-23
EP1139334A3 (en) 2002-09-11
CA2337368C (en) 2006-09-12
CA2337368A1 (en) 2001-09-29

Similar Documents

Publication Publication Date Title
EP1414227B1 (en) Event detection for multiple voice channel communications
US7224774B1 (en) Real-time call control system
US6751306B2 (en) Local on-hold information service with user-controlled personalized menu
US6577859B1 (en) Cellular phone system with outgoing message selection system
US5396542A (en) Method for use by a telecommunications system in enabling improved attendant services
JP5051945B2 (ja) 通話者入力レート制御方法、通話者入力レート制御システム、及び通話者入力レート制御装置
US6778660B2 (en) Customer interaction system
JP2002503423A (ja) ネットワークベースのコール継続サービスのためのシステムおよび方法
JP2001103161A (ja) 電気通信交換システムにおけるリングバック期間を利用してのアドバタイズメントの送信
CA2313974A1 (en) Method and system for call answering
US20100151915A1 (en) Headset or Hands-free Set for Mobile Telephones Monitoring Voice Mail Messages in Real-Time and Offering the Option to Take Over Conversation with the Caller
US20090274292A1 (en) Assignment of Call-Center Agents to Incoming Calls
US20070003045A1 (en) Off hold notification in communication networks
US6763090B2 (en) Telephone set with on hold function
US20050135575A1 (en) Tuning an interactive voise response system
US6925162B1 (en) Method and system for negotiated call forwarding
US7123709B1 (en) Method for audio stream monitoring on behalf of a calling party
CN101352025A (zh) 用于向主叫方播放消息的方法和通信系统
CN101072257A (zh) 实现语音数据共享的方法和智能终端
EP2099253A1 (en) Method for voice activity detection controlling and controlling device thereof
US7023965B2 (en) Apparatus and method for displaying a name of a speaker on a telecommunication conference call
JP3770376B2 (ja) Ipネットワークにおける保留音送出システム及び保留音送出方法
EP0855827A2 (en) Method of providing conferencing in telephony
GB2366142A (en) Call setup
US20040028202A1 (en) Method and system for providing conference feature between internet call and telephone network call in a webphone system

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080328

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080328

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101018

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101025

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110125

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20110125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110822

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111117

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120625

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120724

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150803

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees