JP2004032742A - 分散音声ブラウザを使用して通話を処理する方法および装置 - Google Patents

分散音声ブラウザを使用して通話を処理する方法および装置 Download PDF

Info

Publication number
JP2004032742A
JP2004032742A JP2003157484A JP2003157484A JP2004032742A JP 2004032742 A JP2004032742 A JP 2004032742A JP 2003157484 A JP2003157484 A JP 2003157484A JP 2003157484 A JP2003157484 A JP 2003157484A JP 2004032742 A JP2004032742 A JP 2004032742A
Authority
JP
Japan
Prior art keywords
markup language
service
speech
speech markup
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003157484A
Other languages
English (en)
Other versions
JP4446022B2 (ja
Inventor
Thomas E Creamer
トーマス、イー、クリーマ
Victor S Moore
ビクター、エス、ムーア
Glen R Walters
グレン、アール、ウォルターズ
Scott L Winters
スコット、エル、ウィンターズ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2004032742A publication Critical patent/JP2004032742A/ja
Application granted granted Critical
Publication of JP4446022B2 publication Critical patent/JP4446022B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Exchange Systems With Centralized Control (AREA)

Abstract

【課題】音声ブラウザの拡張性と、性能を高めるための解決策を提供すること。
【解決手段】本発明は、解析された音声マークアップ言語データを解釈するように構成された、複数のサービスプロセッサを配置し、電話サービスを表す音声マークアップ言語データを、検索し、解析するように構成された、複数の音声マークアップ言語パーサーを配置する、分散音声ブラウザを使用して、呼を処理する方法を含むことができる。この複数のサービスプロセッサと、この複数のマークアップ言語パーサーを、一つ以上のセッションマネジャーの中に登録できる。したがって、受信された電話サービス要求の構成要素を、音声マークアップ言語パーサーに振り分け、解析された音声マークアップ言語データを、サービスプロセッサに振り分けることができる。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は電話の分野に関し、より詳細には、電話サービスのために、音声ブラウザを使用すること関する。
【0002】
【従来の技術】
音声ブラウザは、通常、音声認識エンジンおよび音声合成エンジンとともに動作し、ユーザは、ネットワークベースの電子コンテンツと、音声で対話できる。すなわち、このユーザは、ネットワークベースの電子文書間をナビゲートするために、音声コマンドを提供することができる。同様に、ネットワークベースの電子コンテンツを、ユーザに聴こえるように、通常は合成音声の形で提供できる。したがって、音声ブラウザは、たとえば、電話、PDA、またはデスクトップコンピュータによって、ネットワークベースの電子コンテンツおよびアプリケーションへの、音声アクセスおよび対話式音声応答を提供できる。
【0003】
音声ブラウザは、VXML(Voice Extensible Markup Language)で符号化されたネットワークベースの電子コンテンツと対話するように構成できる。VXMLは、分散音声アプリケーション用のマークアップ言語であり、合成音声、デジタル音声、音声入力とDTMF(Dual Tone Multifrequency)キー入力の認識、音声入力の記録、電話、および混合イニシアチブ会話を形づける、音声ダイアログを作成するように設計されている。
【0004】
この拡張機能を音声ブラウザが提供するので、通信製品および通信サービスのプロバイダは、電話サービスおよび/またはその特徴を提供するために、音声ブラウザ技術を使用し始めている。たとえば、音声ブラウザを、対話式音声応答システムのコンテンツ内で使用できる。しかし、現在では、音声ブラウザは、いくつかの性能に関する欠陥を被っている。具体的には、音声ブラウザは、通常、一つのコンピューティングマシン上の一つのアプリケーション動作として実施される。こうした従来の音声ブラウザの実装によっては、多量の通話量の処理は不可能であり、または、多量の通話を処理する環境において必要な、音声のセッション数をサポートすることが不可能である。さらに、一度実装されると、従来の音声ブラウザは、要求に従って拡張できない。その結果、要求が増大すると、従来の音声ブラウザの性能は低下するようになる。
【0005】
【発明が解決しようとする課題】
本明細書で開示の発明は、音声ブラウザ拡張性と、性能を高めるための解決策を提供する。具体的には、一つのコンピューティングマシン上で実行されなければならない一つのアプリケーションとして音声ブラウザを実施するのではなく、本発明は、音声ブラウザをいくつかの構成要素に区分けする。各構成要素を、別々のコンピューティングマシン上で実行するために、分散できる。たとえば、この音声ブラウザを、解析、セッション管理およびサービス実現を扱うために、別々の構成要素に区分けできる。この音声ブラウザのさまざまな構成要素は、必要に応じて複製でき、増大したネットワーク負荷をサポートする。その結果、本発明は、増量した通話および音声セッションを、サポートできる。さらに、音声処理を増大させる必要があるときは、本発明は、増大したトラフィック(通話量)を処理するためにそれに応じて拡張させることができる。
【0006】
【課題を解決するための手段】
本発明の一つの側面によって、分散音声ブラウザの中に通話を処理する方法を含むことができる。本方法は、解析された音声マークアップ言語データを解釈するように構成された複数のサービスプロセッサを配置し、電話サービスを表す音声マークアップ言語データを検索し解析するように構成された複数の音声マークアップ言語パーサーを配置することを、含むことができる。この複数のサービスプロセッサと複数のマークアップ言語パーサーを、一つ以上のセッションマネジャーの中に登録できる。したがって、受信された電話サービス要求の構成要素を、音声マークアップ言語パーサーに振り分け、音声マークアップ言語パーサーの結果として得られる解析された音声マークアップ言語データを、セッションマネジャーを介してサービスプロセッサに振り分けることができる。
【0007】
たとえば、電話サービス要求を、セッションマネジャー内で受信できる。この電話サービス要求は、サービスプロセッサの特定の一つと関連付けられ、この電話サービスを表す音声マークアップ言語データの場所を指定できる。このセッションマネジャーは、使用可能な音声マークアップ言語パーサーを決定でき、この使用可能な音声マークアップ言語パーサーに対して、指定された場所を提供できる。
【0008】
この音声マークアップ言語パーサーは、この指定された場所から、この音声マークアップ言語データを検索し、音声マークアップ言語データを解析することができ、そのことにより、音声マークアップ言語データを、サービスプロセッサによって使用できもしくは解釈することができる、中間フォーマットへ変換する。この解析された音声マークアップ言語データを、解析された音声マークアップ言語データを関連付けられたサービスプロセッサに提供できる、セッションマネジャーに提供できる。このサービスプロセッサは、この解析された音声マークアップ言語データを実行し、電話サービスを実施できる。サービスプロセッサ、音声マークアップ言語パーサーおよびこのセッションマネジャーの追加したものを、必要に応じて複製でき、増大した通話量に適応できる。
【0009】
本発明による方法は、一つ以上の仮想マシン内に、複数のサービスプロセッサを示し、および、複数のサービスプロセッサ用の仮想マシンとは別の、一つ以上の仮想マシン内に、複数の音声マークアップ言語パーサーを示すことを含むことができる。さらに、この方法は、少なくとも第1のコンピューティングマシン内に複数のサービスプロセッサを配置し、少なくとも第2のコンピューティングマシン内に複数の音声マークアップ言語パーサーを配置し、そして、少なくとも第3のコンピューティングマシン内にセッションマネジャーを配置することを含むことができる。第1、第2、および第3のコンピューティングマシンを、ネットワークを介して、通信可能なようにリンクすることができる。
【0010】
本発明の他の側面は、分散音声ブラウザシステムを備えることができる。このシステムは、電話サービスの音声マークアップ言語表記を解析するように構成された解析の構成要素と、電話サービスの解析された音声マークアップ言語表記を解釈するための実行環境を提供するように構成された電話サービス実現の構成要素を、有することができる。セッション管理の構成要素も、また、有することができる。このセッション管理の構成要素は、解析の構成要素と電話サービス実現の構成要素の動作を、調整するように構成することができる。
【0011】
この解析の構成要素は、一つ以上の音声マークアップ言語パーサーを備えることができ、この電話サービス実現の構成要素は、一つ以上のサービスプロセッサを備えることができる。このセッション管理の構成要素は、一つ以上のセッションマネジャーを備えることができる。この音声マークアップ言語パーサーと、サービスプロセッサは、Java(R)仮想マシンなどの仮想マシン内で実行するように、構成できる。
【0012】
この音声マークアップ言語プロセッサのための仮想マシンは、サービスプロセッサ用の仮想マシンから独立させることができることに留意されたい。さらに、各音声マークアップ言語パーサーと、各サービスプロセッサは、独立した仮想マシン内で実行できる。この解析の構成要素、セッション管理の構成要素および電話サービスの構成要素は、別々の分散コンピューティングマシン内で実行できる。
【0013】
図面には、現在好ましい実施形態が示されるが、本発明はこの構成および例示に限定されるものではないことは理解されたい。
【0014】
【発明の実施の形態】
本明細書で開示の発明は、音声ブラウザ拡張性と、性能を高めるための解決策を提供する。具体的には、本発明は、音声ブラウザを、いくつかの構成要素に区分けすることができ、そのことによって、分散音声ブラウザを形成する。この分散音声ブラウザのさまざまな構成要素は、別々のコンピューティングマシン上で実行できる。音声ブラウザのこのさまざまな構成要素は、必要に応じて複製でき、増大した通話量を処理するために拡張できることに留意されたい。
【0015】
図1は本明細書で開示の発明の構成に従った、電話サービスおよび/またはその特徴(以下、「サービス」と呼ぶ)を実施するための例示的なシステム100を示す。図1に示すように、このシステム100は、メディアゲートウェイ105、ビーン/スクリプトアプリケーション(サービスプロセッサ)115、セッションマネジャー120、VXML(Voice Extensible Markup Language)パーサー125、HTTP(hyper−text transfer protocol)サーバ130、およびデータ記憶135を備えることができる。このデータ記憶135は、文書、音声、テキストなどのようなものを指定する、一つ以上のVXMLスクリプトを有することができる。たとえば、スクリプト109の、このVXMLスクリプトは、電話サービスのスクリプトを実施する。このデータ記憶135内のVXMLスクリプトに、このHTTPサーバ130を介して、アクセスできる。このデータ記憶135は一つのデータ記憶として示されるが、これは、一つ以上の分散データ記憶として実装できることは明らかである。
【0016】
メディアゲートウェイ105は、T1回線および/またはISDN回線などの、一つ以上のトランク通信回線に、通信できるようにリンクできる。各トランク通信引き込み回線165は、メディアゲートウェイ105とトランク通信回線165との間のインターフェースとして働くチャネルプロセッサ160と、インターフェースできる。一つのチャネルプロセッサ160を、対応する電話交換器の各音声回路用に備えることができる。このメディアゲートウェイ105は、アプリケーション表107、および、ビーン/スクリプトインターフェース110を備えることもできる。このアプリケーション表107は、以下では、ディレクトリ番号と呼ぶDNIS(dialed number inbound services)間の関連を指定でき、この電話サービスのVXMLスクリプトの実施は、データ記憶135内に記憶される。より具体的には、このアプリケーション表107は、ディレクトリ番号、および、既に登録されているディレクトリ番号用の電話サービスの、リスティングを保持する。このアプリケーション表107は、さらに、電話サービスのさまざまなVXMLスクリプトの実施を検索できる、ネットワークの場所を指定する。
【0017】
したがって、通話の受信時には、このメディアゲートウェイ105は、この通話の受信によって指定されたディレクトリ番号を判断できる。このディレクトリ番号を、アプリケーション表107を使用して、一つ以上のVXMLスクリプトと一致させることができる。したがって、既に登録されているディレクトリ番号のための電話サービスのVXMLスクリプトの実施の場所またはアドレスを、識別することができる。電話サービスのこのVXMLスクリプトの場所を、セッションマネジャー120に提供することができる。
【0018】
このビーン/スクリプトインターフェース110は、一つのLAN(ローカルエリアネットワーク)を他のLANに接続する、ブリッジサービスもしくはブリッジ機能を備えることができるが、このインターフェース110をメディアゲートウェイ105内に含めることができる。このビーン/スクリプトインターフェース110は、サービスプロセッサ115と、チャネルプロセッサ160や音声インターフェース140などのメディアゲートウェイ105の他の構成要素との間の通信を、促進することができる。このビーン/スクリプトインターフェース110は、ここで記述されるサービスプロセッサ115によって解釈されるような、VXMLスクリプトを介して提供できる機能範囲をサポートするように、構成できる。具体的には、VXMLスクリプトが拡張通話制御およびTCAP(transaction capabilities application part)機能をサポートできるときは、このビーン/スクリプトインターフェース110も、これらの通話制御およびTCAP機能をサポートするように構成できる。この音声インターフェース140は、音声認識と、テキスト音声変換(TTS)機能を提供できる。したがって、トランク通信回線165を介して受信された音声を、テキストに変換でき、テキストデータを、トランク通信回線165を介して一人以上の加入者に提供される、音声ストリームに変換できる。
【0019】
サービスプロセッサ115、セッションマネジャー120、およびVXMLパーサー125を合わせて、分散音声ブラウザの構成要素を提供する。このVXMLパーサー125を、実行時に示し、HTTPサーバ130を介してデータ記憶135からVXMLスクリプトを検索できる。このVXMLパーサー125は、検索されたVXMLスクリプトを、このサーバプロセッサ115にマップでき、かつサーバ115によって解釈できる、中間フォーマットに変換できる。このVXMLスクリプトは、通話許可(Allow Call)、通話ブロック(Block Call)、通話転送(Forward Call)、通話選択的転送(Selective Forward Call)、および通話ブリッジ(Bridge Call)などのTCAP処理を定義する新規タグを含めるように、拡張できることに留意されたい。したがって、VXMLパーサー125も、VXMLスクリプトのいずれの追加拡張タグをも識別するように構成できる。
【0020】
このサービスプロセッサ115は、分散コンピューティング環境内の、同じコンピュータシステム内、または、異なるコンピュータシステム内の、他の構成要素と結合できる、再使用可能なソフトウェア構成要素であることができる。一つのサービスプロセッサ115を、各チャネルのプロセッサ160の実行時に示すことができ、したがって、サービスプロセッサ115を、特定のチャネルプロセッサに関連付けることができる。このサービスプロセッサ115は、解析されたVXMLスクリプトが、このVXMLスクリプトによって指定された電話サービスを実施するための実行環境を提供する、インタープリタとして効果的に働く。したがって、このサービスプロセッサ115は、メディアゲートウェイ105の内部機能を、この電話サービスの解析されたVXMLスクリプト表記と結びつける。従って、このサービスプロセッサ115は、解析されたVXMLスクリプトによって指定されたような電話サービスを実行するために、TTSおよび音声認識機能にアクセスできる。たとえば、テキストおよび認識された音声を、VXMLスクリプト、フォーム、および/または文書のフィールドへ、移植するために使用できる。
【0021】
サービスプロセッサ115およびVXMLパーサー125は、それぞれ、Java(R)仮想マシン145および155内で実行できることに留意されたい。図1は、一つのJava(R)仮想マシン145および155内で実行する複数のサービスプロセッサ115およびVXMLパーサー125を示すが、各サービスプロセッサ115および各VXMLパーサー125は、個々のJava(R)仮想マシン内で実行でき、そのことによって、一つのプログラム内で発生するエラーが他のプログラムに不利な影響を与えるというリスクを最小化することができる。
【0022】
各サービスプロセッサ115および各VXMLパーサー125は、セッションマネジャー120の中に登録できる。したがって、このセッションマネジャー120は、サービスプロセッサ115およびVXMLパーサー125のうちのどれを通話の処理のために使用できるかを追跡できる。このセッションマネジャー120は、さらに、サービスプロセッサ115/VXMLパーサー125の対の動作を調整できる。このセッションマネジャー120は、サービスプロセッサ115とVXMLパーサー125との間の情報を、渡すことができる。具体的に、メディアゲートウェイ105からセッションマネジャー120へ与えられる要求は、着信通話ディレクトリ番号、URL(universal resource locators)を有し電話サービスの一つ以上のVXMLスクリプト表記を指定する一つ以上のURI(universal resource identifiers)、および、この通話を受信する特定のチャネルプロセッサを表す識別子(ID)を含むことができる。このセッションマネジャー120は、ローカルのデータ記憶に情報を記憶できる。したがって、このセッションマネジャー120は、この受信URIを提供することができる、空きVXMLパーサー125を決定できる。さらに、VXMLパーサー125で得られた結果を、記憶されたURI、着信通話ディレクトリ番号、およびチャネルプロセッサIDに従って、適切なサービスプロセッサ115へ戻すことができる。
【0023】
サービスプロセッサ115と、VXMLパーサー125を伴う場合には、複数のセッションマネジャー120は、一つのJava(R)仮想マシン内で実行でき、あるいは、各セッションマネジャー120は、個々のJava(R)仮想マシン内で実行できる。どの場合にも、前述したように、このサービスプロセッサ115、セッションマネジャー120、およびVXMLパーサー125は、コンピューティングネットワークを介して分散された、別々のコンピューティングマシン内に存在することができる。さらに、増大した処理の負荷をサポートするために、必要に応じて、これらのさまざまな構成要素を複製できる。その結果、サービスプロセッサ115、セッションマネジャー120、およびVXMLパーサー125を合わせて、多量のシステム要求をサポートするために調整できる、分散音声ブラウザアーキテクチャを提供する。
【0024】
キャッシュメモリ170を、このセッションマネジャー120とこのVXMLパーサー125との間に配置できる。このキャッシュメモリ170は、多数のフェッチングを低減し、頻繁に使用されるVXMLスクリプトを解析することによって、システム性能を上げることができる。本明細書で開示の発明構成によって、さらに、一つ以上のファイアウォール175、180、185を備えることができる。ファイアウォールは、本明細書で開示するようなシステム100の動作には必要ではないけれども、ファイアウォールの追加によって追加のネットワークセキュリティが提供される。具体的には、ファイアウォール175と180によって、多くの通信会社によって要求される、2重のファイアウォール保護が提供される。ファイアウォール185によって、VXMLパーサー125を、企業または他のプライベートネットワークから分離する機能が提供できる。
【0025】
図2は、図1のシステムによって行われるような、電話サービスの特徴を実施する方法200を示すフローチャートである。この方法200は、図1のシステムが、メディアゲートウェイの各チャネルプロセッサ用の少なくとも一つのサービスプロセッサに示された場合に、開始できる。さらに、VXMLパーサーなどの一つ以上のパーサーを、このサービスプロセッサおよびパーサーが、セッションマネジャーの中に登録されるように、示すことができる。このサービスプロセッサおよびこのパーサーとの間の、一対一の対応は、必要でないことに留意されたい。どのイベントにおいても、電話交換機が通話を受信できる。電話交換機は、メディアゲートウェイの空きチャネルプロセッサを選択でき、および、通話を受信するために、たとえばインバンド・シグナリングまたはISDNのDチャネルを使用して、メディアゲートウェイを照会できる。このメディアゲートウェイが通話を受信したことに応答して、この電話交換機は、この通話を、選択したチャネルプロセッサに適用できる。したがって、ステップ205で、この通話を、メディアゲートウェイによって識別できる。ステップ210で、受信した通話の着信通話ディレクトリ番号を決定できる。
【0026】
ステップ215で、この決定されたディレクトリ番号と関連する、一つ以上の通話処理スクリプトを識別できる。たとえば、着信通話ディレクトリ番号、および、関連するVXMLスクリプトのリスティングを調べ、既に登録されているこのディレクトリ番号のための、特定の通話処理スクリプト、または、電話サービスのVXMLスクリプト表記を決定できる。ステップ220で、このメディアゲートウェイは、TCP/IP接続を介して、セッションマネジャーへ、少なくとも以下の情報を送付できる。その情報は、着信通話ディレクトリ番号、既に登録されているこのディレクトリ番号のための電話サービスの通話処理スクリプト表記を指定する一つ以上のURI、および、この通話を受信する特定のチャネルプロセッサを表す識別子(ID)である。
【0027】
使用可能なパーサーにこのURIを送信する前に、ステップ225に示すように、このセッションマネジャーは、TCP/IP接続を介して、キャッシュメモリに照会し、URIによって指定された通話処理スクリプトがキャッシュメモリ内に含まれているか否かを判断できる。含まれている場合は、この通話処理スクリプトは、パーサーによって既に解析され、サービスプロセッサにマップする中間フォーマットの形で存在する。したがって、この解析された通話処理スクリプトは、ステップ230で、キャッシュメモリから検索でき、この方法は、ステップ250に進むことができる。しかし、このキャッシュメモリが、URIによって指定された通話処理スクリプトを含んでいない場合は、この方法はステップ235に進むことができる。
【0028】
ステップ235で、このセッションマネジャーは、使用可能なパーサーを識別し、このパーサーへ、TCP/IP接続を介して、URIを提供できる。このセッションマネジャーは、このチャネルプロセッサのIDのローカルコピーを、記憶できることに留意されたい。ステップ240で、このパーサーは、HTTPサーバへHTTP要求を発行し、このURIによって指定された通話処理スクリプトを検索できる。この通話処理スクリプトは、たとえば、VXML文書、VXMLテキスト、VXMLスクリプト、および、音声の選択された部分などの、音声マークアップ言語スクリプトを含むことができる。ステップ245で、このパーサーは、要求された通話処理スクリプトを、HTTP接続を介して、受信することができる。次いで、このパーサーは、この通話処理スクリプトを解析し、この通話処理スクリプトを、サービスプロセッサによって解釈できる中間フォーマットに変換できる。
【0029】
ステップ250で、解析された通話処理スクリプトを、このパーサーから、セッションマネジャーへ、TCP/IP接続を介して、送信することができる。このチャネルプロセッサのIDを保持しているセッションマネジャーは、ステップ255で、この通話を受信したチャネルプロセッサと関連付けられたサービスプロセッサ(スクリプト/ビーン)を識別できる。ステップ260で、このセッションマネジャーは、この解析された通話処理スクリプトを、識別されたサービスプロセッサへ転送できる。したがって、このサービスプロセッサは、解析された通話処理スクリプトを実行することによって、電話サービスを実施できる。ステップ265で、このサービスプロセッサは、メディアゲートウェイの音声プロセッサのような要求されたいずれの機能にも、この電話サービスを実施するためのビーン/スクリプトインターフェースを介して、アクセスできる。
【0030】
本明細書で開示の発明は、音声ブラウザをいくつかの構成要素に区分けすることにより、音声ブラウザの拡張性と、性能を高める解決策を提供する。たとえば、この音声ブラウザを、解析、セッション管理およびサービス実現の処理のそれぞれを、別々のコンピューティングマシン上に配置し、および実行することができるように、別々の構成要素に区分けできる。さらに、この音声ブラウザアーキテクチャのさまざまな構成要素は、必要に応じて複製でき、本発明によって、増大した通話量をサポートすることができ、また、拡張可能な音声ブラウザの解決策を提供する。
【0031】
本発明は、ハードウェア、ソフトウェア、または、ハードウェアとソフトウェアの組み合わせの形で実現できる。本発明は、一つのコンピュータシステム内の集約形式で実現でき、あるいは、異なる構成要素がいくつかの相互接続されたコンピュータシステムにわたって展開されている、分散形式で実現できる。いずれの種類のコンピュータシステムも、または、本明細書で記述の方法を実行するために適した他の装置が、本発明に適している。ハードウェアとソフトウェアの典型的な組み合わせは、ロードや、実行時に、本明細書で記述の方法を成し遂げるようにコンピュータシステムを制御するコンピュータプログラムをもつ、汎用目的のコンピュータシステムであることができる。
【0032】
本発明は、また、本明細書で記述の方法の実施を可能にする全ての特徴を備えており、コンピュータシステムにロードされると、前述した方法を成し遂げることが可能である、コンピュータプログラム製品に組み込むこともできる。本明細書のコンピュータプログラムとは、いずれの言語における、命令の組のコードもしくは表記であって、情報処理能力を有するシステムが、特定の機能を、直接、もしくは、a)他の言語、コードもしくは表記に変換、b)異なるマテリアルフォームの形の再生成、の一方もしくは両方の後に、実行させる、すべての表現を意味する。
【0033】
本発明は、本発明の主旨もしくは本質的特性から外れることなく他の形式で具体化できる。したがって、本発明の範囲は、前述した詳細な説明ではなく、特許請求の範囲に示している。
【図面の簡単な説明】
【図1】本明細書で開示の構成に従った分散音声ブラウザを示す概略図である。
【図2】図1の分散音声ブラウザの動作方法を示すフローチャートである。

Claims (25)

  1. 分散音声ブラウザを使用して、通話を処理する方法であって、
    解析された音声マークアップ言語データを解釈するように構成された、複数のサービスプロセッサを配置するステップと、
    電話サービスを表す音声マークアップ言語データを検索しおよび解析するように構成された、複数の音声マークアップ言語パーサーを配置するステップと、
    少なくとも一つのセッションマネジャーの中に、前記複数のサービスプロセッサ、および、前記複数のマークアップ言語パーサーを登録するステップと、
    受信した電話サービス要求の構成要素を、前記音声マークアップ言語パーサーに振り分け、前記解析された音声マークアップ言語データを、前記サービスプロセッサに振り分け、そのことにより、前記電話サービスを実施するステップと、を含む方法。
  2. 電話サービス要求を受信するステップを更に含み、前記電話サービス要求は、前記サービスプロセッサの特定の一つと関連付けられており、かつ前記電話サービスを表す前記音声マークアップ言語データの位置を指定するものである、請求項1に記載の方法。
  3. 使用可能な音声マークアップ言語パーサーを決定するステップと、
    前記使用可能な音声マークアップ言語パーサーに、前記指定した位置を提供するステップと、
    をさらに含む、請求項2に記載の方法。
  4. 前記指定した位置から前記音声マークアップ言語データを検索するステップと、
    前記音声マークアップ言語データを中間フォーマットに変換するために、前記音声マークアップ言語データを解析するステップと、
    をさらに含む、請求項3に記載の方法。
  5. 前記解析された音声マークアップ言語データを受信するステップと、
    前記関連付けられたサービスプロセッサに、前記解析された音声マークアップ言語データを提供するステップと、
    をさらに含む、請求項4に記載の方法。
  6. 前記解析された音声マークアップ言語データを実行して、前記電話サービスを実施するステップをさらに含む、請求項5に記載の方法。
  7. 前記サービスプロセッサ、前記音声マークアップ言語パーサー、および、前記セッションマネジャーを、追加的に複製するステップとをさらに含む、請求項1に記載の方法。
  8. 前記複数のサービスプロセッサを、少なくとも一つの仮想マシン内に示し、前記複数の音声マークアップ言語パーサーを、前記複数のサービスプロセッサ用の前記少なくとも一つの仮想マシンとは別の、少なくとも一つの仮想マシン内に示すステップとをさらに含む、請求項1に記載の方法。
  9. 前記複数のサービスプロセッサを、少なくとも第1のコンピューティングマシン内に、前記複数の音声マークアップ言語パーサーを少なくとも第2のコンピューティングマシン内に、前記セッションマネジャーを少なくとも第3のコンピューティングマシン内に配置するステップであって、前記第1、前記第2、および、前記第3のコンピューティングマシンを、ネットワークを介して通信可能なようにリンクするステップをさらに含む、請求項7に記載の方法。
  10. 電話サービスの音声マークアップ言語表記を、検索し、解析するように構成された解析の構成要素と、
    前記電話サービスの前記解析された音声マークアップ言語表記を解釈するための、実行環境を提供するように構成された電話サービス実現の構成要素と、
    前記解析の構成要素、および、前記電話サービス実現の構成要素の動作を、調整するように構成されたセッション管理の構成要素と、
    を含む分散音声ブラウザシステム。
  11. 前記解析の構成要素が、複数の音声マークアップ言語パーサーをさらに含む、請求項10に記載のシステム。
  12. 前記電話サービスの構成要素が、複数のサービスプロセッサを含む、請求項11に記載のシステム。
  13. 前記セッション管理の構成要素が、複数のセッションマネジャーを含む、請求項12に記載のシステム。
  14. 前記音声マークアップ言語パーサーが、少なくとも一つの仮想マシン内で実行するように構成される、請求項13に記載のシステム。
  15. 前記サービスプロセッサが、前記一つの音声マークアップ言語パーサー用の前記少なくとも一つの仮想マシンと独立している、少なくとも一つの仮想マシン内で実行するように構成される、請求項14に記載のシステム。
  16. 前記解析の構成要素、前記セッション管理の構成要素、および、前記電話サービス実現の構成要素が、別々のコンピューティングマシン内で実行する、請求項10に記載のシステム。
  17. マシンによって実行可能の複数のコードセクションをもつコンピュータプログラムを記憶したコンピュータ可読記憶であって、前記コンピュータプログラムが、
    解析された音声マークアップ言語データを解釈するように構成された、複数のサービスプロセッサを配置するステップと、
    電話サービスを表す音声マークアップ言語データを、検索し、解析するように、構成された、複数の音声マークアップ言語パーサーを配置するステップと、
    少なくとも一つのセッションマネジャーに、前記複数のサービスプロセッサ、および、前記複数のマークアップ言語パーサーを、登録するステップと、
    受信した電話サービス要求の構成要素を、前記音声マークアップ言語パーサーに振り分け、前記解析された音声マークアップ言語データを前記サービスプロセッサに振り分けるステップであって、そのことにより前記電話サービスを実施するステップと、
    をコンピュータに実行させるためのものである、コンピュータ可読記憶装置。
  18. 電話サービス要求を、前記サービスプロセッサの特定の一つと関連付け、前記電話サービスを表す前記音声マークアップ言語データの位置を指定する、前記電話サービス要求を受信するステップをさらに含む、請求項17に記載のコンピュータ可読記憶装置。
  19. 使用可能な音声マークアップ言語パーサーを、決定するステップと、
    前記使用可能な音声マークアップ言語パーサーに、前記指定された位置を提供するステップと、
    をさらに含む、請求項18に記載のコンピュータ可読記憶装置。
  20. 前記指定された位置から前記音声マークアップ言語データを検索するステップと、
    前記音声マークアップ言語データを解析し、前記音声マークアップ言語データを中間フォーマットに変換するステップと、
    をさらに含む、請求項19に記載のコンピュータ可読記憶装置。
  21. 前記解析された音声マークアップ言語データを検索するステップと、
    前記解析された音声マークアップ言語データを、前記関連付けられたサービスプロセッサに提供するステップと、
    をさらに含む、請求項20に記載のコンピュータ可読記憶装置。
  22. 前記解析された音声マークアップ言語データを実行し、前記電話サービスを実施するステップをさらに含む、請求項21に記載のコンピュータ可読記憶装置。
  23. 前記サービスプロセッサ、前記音声マークアップ言語パーサー、および、前記セッションマネジャーを、追加的に複製するステップをさらに含む、請求項17に記載のコンピュータ可読記憶装置。
  24. 少なくとも一つの仮想マシン内に、前記複数のサービスプロセッサを配置し、前記複数のサービスプロセッサ用の前記少なくとも一つの仮想マシンとは別の、少なくとも一つの仮想マシン内に、前記複数の音声マークアップ言語パーサーを配置するステップをさらに含む、請求項17に記載のコンピュータ可読記憶装置。
  25. 前記複数のサービスプロセッサを、少なくとも第1のコンピューティングマシン内に配置し、前記複数の音声マークアップ言語パーサーを、少なくとも第2のコンピューティングマシン内に配置し、前記セッションマネジャーを、少なくとも第3のコンピューティングマシン内に配置するステップを有し、前記第1、前記第2、および前記第3のコンピューティングマシンが、ネットワークを介して通信可能なようにリンクされている、
    請求項24に記載のコンピュータ可読記憶装置。
JP2003157484A 2002-06-14 2003-06-03 分散音声ブラウザを使用して通話を処理する方法および装置 Expired - Fee Related JP4446022B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/172,279 US8000970B2 (en) 2002-06-14 2002-06-14 Distributed voice browser

Publications (2)

Publication Number Publication Date
JP2004032742A true JP2004032742A (ja) 2004-01-29
JP4446022B2 JP4446022B2 (ja) 2010-04-07

Family

ID=29733013

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003157484A Expired - Fee Related JP4446022B2 (ja) 2002-06-14 2003-06-03 分散音声ブラウザを使用して通話を処理する方法および装置

Country Status (2)

Country Link
US (2) US8000970B2 (ja)
JP (1) JP4446022B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008505553A (ja) * 2004-06-30 2008-02-21 グレネイル エレクトロニクス インコーポレイテッド 分散型カスタマイズ可能ボイスメールシステム

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1524832A1 (en) * 2003-10-17 2005-04-20 Hewlett-Packard Development Company, L.P. Voice mark-up language having an application transfer tag and interpreter therefore
US7831656B2 (en) * 2004-12-29 2010-11-09 International Business Machines Corporation Effortless association between services in a communication system and methods thereof
US7409344B2 (en) * 2005-03-08 2008-08-05 Sap Aktiengesellschaft XML based architecture for controlling user interfaces with contextual voice commands
US9313307B2 (en) * 2005-09-01 2016-04-12 Xtone Networks, Inc. System and method for verifying the identity of a user by voiceprint analysis
US20100158217A1 (en) 2005-09-01 2010-06-24 Vishal Dhawan System and method for placing telephone calls using a distributed voice application execution system architecture
US9456068B2 (en) * 2005-09-01 2016-09-27 Xtone, Inc. System and method for connecting a user to business services
US11102342B2 (en) 2005-09-01 2021-08-24 Xtone, Inc. System and method for displaying the history of a user's interaction with a voice application
US9426269B2 (en) * 2005-09-01 2016-08-23 Xtone Networks, Inc. System and method for performing certain actions based upon a dialed telephone number
US8964960B2 (en) * 2005-09-01 2015-02-24 Xtone Networks, Inc. System and method for interacting with a user via a variable volume and variable tone audio prompt
US9799039B2 (en) 2005-09-01 2017-10-24 Xtone, Inc. System and method for providing television programming recommendations and for automated tuning and recordation of television programs
US11153425B2 (en) * 2005-09-01 2021-10-19 Xtone, Inc. System and method for providing interactive services
US20100166161A1 (en) * 2005-09-01 2010-07-01 Vishal Dhawan System and methods for providing voice messaging services
WO2007028128A2 (en) * 2005-09-01 2007-03-08 Vishal Dhawan Voice application network platform
US9253301B2 (en) * 2005-09-01 2016-02-02 Xtone Networks, Inc. System and method for announcing and routing incoming telephone calls using a distributed voice application execution system architecture
US7644000B1 (en) * 2005-12-29 2010-01-05 Tellme Networks, Inc. Adding audio effects to spoken utterance
GB2564395B (en) 2017-07-06 2020-04-29 Metaswitch Networks Ltd Media gateway

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1994000945A1 (en) 1992-06-25 1994-01-06 Teledata Solutions, Inc. Call distributor
US5541986A (en) 1993-07-27 1996-07-30 Bell Communications Research, Inc. Method and system for automated telecommunications service script consolidation and downloading
US5724406A (en) 1994-03-22 1998-03-03 Ericsson Messaging Systems, Inc. Call processing system and method for providing a variety of messaging services
FI943609A (fi) * 1994-08-03 1996-02-04 Nokia Telecommunications Oy Menetelmä kanavan allokoimiseksi solukkoradiojärjestelmässä
US6091954A (en) * 1994-09-01 2000-07-18 Telefonaktiebolaget Lm Ericsson Channel assignment in enhanced fixed-plan mobile communications systems
US6088749A (en) 1995-11-30 2000-07-11 Excel Switching Corp. Universal API with generic call processing message having user-defined PPL event ID and generic response message for communications between telecommunications switch and host application
US5721729A (en) 1996-01-24 1998-02-24 Klingman; Edwin E. Universal input call processing system
US6272538B1 (en) 1996-07-30 2001-08-07 Micron Technology, Inc. Method and system for establishing a security perimeter in computer networks
US6091808A (en) 1996-10-17 2000-07-18 Nortel Networks Corporation Methods of and apparatus for providing telephone call control and information
US6002673A (en) * 1997-03-21 1999-12-14 Lucent Technologies Inc. Method for channel management in a TDMA communication system
US6418461B1 (en) 1997-10-06 2002-07-09 Mci Communications Corporation Intelligent call switching node in an intelligent distributed network architecture
US6175619B1 (en) 1998-07-08 2001-01-16 At&T Corp. Anonymous voice communication using on-line controls
US6134313A (en) 1998-10-23 2000-10-17 Toshiba America Information Systems, Inc. Software architecture for a computer telephony system
US6625134B1 (en) * 1998-11-09 2003-09-23 Samsung Electronics Co., Ltd. System and method for reallocating a traffic channel in soft handoff state
US6707889B1 (en) * 1999-08-24 2004-03-16 Microstrategy Incorporated Multiple voice network access provider system and method
WO2001052514A2 (en) * 2000-01-07 2001-07-19 Informio, Inc. Methods and apparatus for an audio web retrieval telephone system
US6922411B1 (en) * 2000-09-29 2005-07-26 Voxeo Corporation Networked computer telephony system driven by web-based applications
US6785707B2 (en) * 2000-11-14 2004-08-31 Bitfone Corp. Enhanced multimedia mobile content delivery and message system using cache management
FI111599B (fi) * 2000-12-28 2003-08-15 Nokia Corp Menetelmä ja järjestelmä matkaviestintään
US20020087325A1 (en) * 2000-12-29 2002-07-04 Lee Victor Wai Leung Dialogue application computer platform
US6891932B2 (en) * 2001-12-11 2005-05-10 Cisco Technology, Inc. System and methodology for voice activated access to multiple data sources and voice repositories in a single session

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008505553A (ja) * 2004-06-30 2008-02-21 グレネイル エレクトロニクス インコーポレイテッド 分散型カスタマイズ可能ボイスメールシステム

Also Published As

Publication number Publication date
US20030233238A1 (en) 2003-12-18
US8000970B2 (en) 2011-08-16
US8170881B2 (en) 2012-05-01
US20110282672A1 (en) 2011-11-17
JP4446022B2 (ja) 2010-04-07

Similar Documents

Publication Publication Date Title
US8170881B2 (en) Distributed voice browser
US6922411B1 (en) Networked computer telephony system driven by web-based applications
KR100870294B1 (ko) 패킷 전화통신망 내에서 호 처리를 구현하는 방법 및 장치
US7058164B1 (en) Externally interrupting a communication session
US20040071275A1 (en) Telephone call handling solution in an interactive voice response system
WO2001024025A1 (en) Method and apparatus for data-linking a mobile knowledge worker to home communication-center infrastructure
US8364490B2 (en) Voice browser with integrated TCAP and ISUP interfaces
US20040109541A1 (en) Telephony voice server
US7266182B2 (en) Method and system for implementing a telephony services feature using voice XML
US7085821B2 (en) TCAP event processing environment
JP4238212B2 (ja) シグナリング・イベントのためのサービス論理コンテキスト・キャッシュ
US7072957B2 (en) Remote administration and monitoring of a service component in a service logic execution environment
US8149999B1 (en) Generating reference variations
US20050249191A1 (en) CCXML/Voice XML browser to implement an AIN intelligent peripheral with call handling functionality
JP4747957B2 (ja) 接続制御装置及び接続制御方法並びにプログラム
KR20030057005A (ko) 음성 포탈 시스템에서의 검색 및 문서 변환 장치

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070502

RD12 Notification of acceptance of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7432

Effective date: 20070502

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20070507

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080729

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080903

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090908

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20090930

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091001

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130129

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4446022

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130129

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees