JP2004032742A - 分散音声ブラウザを使用して通話を処理する方法および装置 - Google Patents
分散音声ブラウザを使用して通話を処理する方法および装置 Download PDFInfo
- Publication number
- JP2004032742A JP2004032742A JP2003157484A JP2003157484A JP2004032742A JP 2004032742 A JP2004032742 A JP 2004032742A JP 2003157484 A JP2003157484 A JP 2003157484A JP 2003157484 A JP2003157484 A JP 2003157484A JP 2004032742 A JP2004032742 A JP 2004032742A
- Authority
- JP
- Japan
- Prior art keywords
- markup language
- service
- speech
- speech markup
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000004891 communication Methods 0.000 title description 8
- 238000004458 analytical method Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 5
- 230000003362 replicative effect Effects 0.000 claims 2
- 239000000470 constituent Substances 0.000 abstract 1
- 238000013515 script Methods 0.000 description 50
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 8
- 244000046052 Phaseolus vulgaris Species 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000007726 management method Methods 0.000 description 6
- 230000004044 response Effects 0.000 description 3
- 238000007792 addition Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
- Exchange Systems With Centralized Control (AREA)
Abstract
【解決手段】本発明は、解析された音声マークアップ言語データを解釈するように構成された、複数のサービスプロセッサを配置し、電話サービスを表す音声マークアップ言語データを、検索し、解析するように構成された、複数の音声マークアップ言語パーサーを配置する、分散音声ブラウザを使用して、呼を処理する方法を含むことができる。この複数のサービスプロセッサと、この複数のマークアップ言語パーサーを、一つ以上のセッションマネジャーの中に登録できる。したがって、受信された電話サービス要求の構成要素を、音声マークアップ言語パーサーに振り分け、解析された音声マークアップ言語データを、サービスプロセッサに振り分けることができる。
【選択図】 図1
Description
【発明の属する技術分野】
本発明は電話の分野に関し、より詳細には、電話サービスのために、音声ブラウザを使用すること関する。
【0002】
【従来の技術】
音声ブラウザは、通常、音声認識エンジンおよび音声合成エンジンとともに動作し、ユーザは、ネットワークベースの電子コンテンツと、音声で対話できる。すなわち、このユーザは、ネットワークベースの電子文書間をナビゲートするために、音声コマンドを提供することができる。同様に、ネットワークベースの電子コンテンツを、ユーザに聴こえるように、通常は合成音声の形で提供できる。したがって、音声ブラウザは、たとえば、電話、PDA、またはデスクトップコンピュータによって、ネットワークベースの電子コンテンツおよびアプリケーションへの、音声アクセスおよび対話式音声応答を提供できる。
【0003】
音声ブラウザは、VXML(Voice Extensible Markup Language)で符号化されたネットワークベースの電子コンテンツと対話するように構成できる。VXMLは、分散音声アプリケーション用のマークアップ言語であり、合成音声、デジタル音声、音声入力とDTMF(Dual Tone Multifrequency)キー入力の認識、音声入力の記録、電話、および混合イニシアチブ会話を形づける、音声ダイアログを作成するように設計されている。
【0004】
この拡張機能を音声ブラウザが提供するので、通信製品および通信サービスのプロバイダは、電話サービスおよび/またはその特徴を提供するために、音声ブラウザ技術を使用し始めている。たとえば、音声ブラウザを、対話式音声応答システムのコンテンツ内で使用できる。しかし、現在では、音声ブラウザは、いくつかの性能に関する欠陥を被っている。具体的には、音声ブラウザは、通常、一つのコンピューティングマシン上の一つのアプリケーション動作として実施される。こうした従来の音声ブラウザの実装によっては、多量の通話量の処理は不可能であり、または、多量の通話を処理する環境において必要な、音声のセッション数をサポートすることが不可能である。さらに、一度実装されると、従来の音声ブラウザは、要求に従って拡張できない。その結果、要求が増大すると、従来の音声ブラウザの性能は低下するようになる。
【0005】
【発明が解決しようとする課題】
本明細書で開示の発明は、音声ブラウザ拡張性と、性能を高めるための解決策を提供する。具体的には、一つのコンピューティングマシン上で実行されなければならない一つのアプリケーションとして音声ブラウザを実施するのではなく、本発明は、音声ブラウザをいくつかの構成要素に区分けする。各構成要素を、別々のコンピューティングマシン上で実行するために、分散できる。たとえば、この音声ブラウザを、解析、セッション管理およびサービス実現を扱うために、別々の構成要素に区分けできる。この音声ブラウザのさまざまな構成要素は、必要に応じて複製でき、増大したネットワーク負荷をサポートする。その結果、本発明は、増量した通話および音声セッションを、サポートできる。さらに、音声処理を増大させる必要があるときは、本発明は、増大したトラフィック(通話量)を処理するためにそれに応じて拡張させることができる。
【0006】
【課題を解決するための手段】
本発明の一つの側面によって、分散音声ブラウザの中に通話を処理する方法を含むことができる。本方法は、解析された音声マークアップ言語データを解釈するように構成された複数のサービスプロセッサを配置し、電話サービスを表す音声マークアップ言語データを検索し解析するように構成された複数の音声マークアップ言語パーサーを配置することを、含むことができる。この複数のサービスプロセッサと複数のマークアップ言語パーサーを、一つ以上のセッションマネジャーの中に登録できる。したがって、受信された電話サービス要求の構成要素を、音声マークアップ言語パーサーに振り分け、音声マークアップ言語パーサーの結果として得られる解析された音声マークアップ言語データを、セッションマネジャーを介してサービスプロセッサに振り分けることができる。
【0007】
たとえば、電話サービス要求を、セッションマネジャー内で受信できる。この電話サービス要求は、サービスプロセッサの特定の一つと関連付けられ、この電話サービスを表す音声マークアップ言語データの場所を指定できる。このセッションマネジャーは、使用可能な音声マークアップ言語パーサーを決定でき、この使用可能な音声マークアップ言語パーサーに対して、指定された場所を提供できる。
【0008】
この音声マークアップ言語パーサーは、この指定された場所から、この音声マークアップ言語データを検索し、音声マークアップ言語データを解析することができ、そのことにより、音声マークアップ言語データを、サービスプロセッサによって使用できもしくは解釈することができる、中間フォーマットへ変換する。この解析された音声マークアップ言語データを、解析された音声マークアップ言語データを関連付けられたサービスプロセッサに提供できる、セッションマネジャーに提供できる。このサービスプロセッサは、この解析された音声マークアップ言語データを実行し、電話サービスを実施できる。サービスプロセッサ、音声マークアップ言語パーサーおよびこのセッションマネジャーの追加したものを、必要に応じて複製でき、増大した通話量に適応できる。
【0009】
本発明による方法は、一つ以上の仮想マシン内に、複数のサービスプロセッサを示し、および、複数のサービスプロセッサ用の仮想マシンとは別の、一つ以上の仮想マシン内に、複数の音声マークアップ言語パーサーを示すことを含むことができる。さらに、この方法は、少なくとも第1のコンピューティングマシン内に複数のサービスプロセッサを配置し、少なくとも第2のコンピューティングマシン内に複数の音声マークアップ言語パーサーを配置し、そして、少なくとも第3のコンピューティングマシン内にセッションマネジャーを配置することを含むことができる。第1、第2、および第3のコンピューティングマシンを、ネットワークを介して、通信可能なようにリンクすることができる。
【0010】
本発明の他の側面は、分散音声ブラウザシステムを備えることができる。このシステムは、電話サービスの音声マークアップ言語表記を解析するように構成された解析の構成要素と、電話サービスの解析された音声マークアップ言語表記を解釈するための実行環境を提供するように構成された電話サービス実現の構成要素を、有することができる。セッション管理の構成要素も、また、有することができる。このセッション管理の構成要素は、解析の構成要素と電話サービス実現の構成要素の動作を、調整するように構成することができる。
【0011】
この解析の構成要素は、一つ以上の音声マークアップ言語パーサーを備えることができ、この電話サービス実現の構成要素は、一つ以上のサービスプロセッサを備えることができる。このセッション管理の構成要素は、一つ以上のセッションマネジャーを備えることができる。この音声マークアップ言語パーサーと、サービスプロセッサは、Java(R)仮想マシンなどの仮想マシン内で実行するように、構成できる。
【0012】
この音声マークアップ言語プロセッサのための仮想マシンは、サービスプロセッサ用の仮想マシンから独立させることができることに留意されたい。さらに、各音声マークアップ言語パーサーと、各サービスプロセッサは、独立した仮想マシン内で実行できる。この解析の構成要素、セッション管理の構成要素および電話サービスの構成要素は、別々の分散コンピューティングマシン内で実行できる。
【0013】
図面には、現在好ましい実施形態が示されるが、本発明はこの構成および例示に限定されるものではないことは理解されたい。
【0014】
【発明の実施の形態】
本明細書で開示の発明は、音声ブラウザ拡張性と、性能を高めるための解決策を提供する。具体的には、本発明は、音声ブラウザを、いくつかの構成要素に区分けすることができ、そのことによって、分散音声ブラウザを形成する。この分散音声ブラウザのさまざまな構成要素は、別々のコンピューティングマシン上で実行できる。音声ブラウザのこのさまざまな構成要素は、必要に応じて複製でき、増大した通話量を処理するために拡張できることに留意されたい。
【0015】
図1は本明細書で開示の発明の構成に従った、電話サービスおよび/またはその特徴(以下、「サービス」と呼ぶ)を実施するための例示的なシステム100を示す。図1に示すように、このシステム100は、メディアゲートウェイ105、ビーン/スクリプトアプリケーション(サービスプロセッサ)115、セッションマネジャー120、VXML(Voice Extensible Markup Language)パーサー125、HTTP(hyper−text transfer protocol)サーバ130、およびデータ記憶135を備えることができる。このデータ記憶135は、文書、音声、テキストなどのようなものを指定する、一つ以上のVXMLスクリプトを有することができる。たとえば、スクリプト109の、このVXMLスクリプトは、電話サービスのスクリプトを実施する。このデータ記憶135内のVXMLスクリプトに、このHTTPサーバ130を介して、アクセスできる。このデータ記憶135は一つのデータ記憶として示されるが、これは、一つ以上の分散データ記憶として実装できることは明らかである。
【0016】
メディアゲートウェイ105は、T1回線および/またはISDN回線などの、一つ以上のトランク通信回線に、通信できるようにリンクできる。各トランク通信引き込み回線165は、メディアゲートウェイ105とトランク通信回線165との間のインターフェースとして働くチャネルプロセッサ160と、インターフェースできる。一つのチャネルプロセッサ160を、対応する電話交換器の各音声回路用に備えることができる。このメディアゲートウェイ105は、アプリケーション表107、および、ビーン/スクリプトインターフェース110を備えることもできる。このアプリケーション表107は、以下では、ディレクトリ番号と呼ぶDNIS(dialed number inbound services)間の関連を指定でき、この電話サービスのVXMLスクリプトの実施は、データ記憶135内に記憶される。より具体的には、このアプリケーション表107は、ディレクトリ番号、および、既に登録されているディレクトリ番号用の電話サービスの、リスティングを保持する。このアプリケーション表107は、さらに、電話サービスのさまざまなVXMLスクリプトの実施を検索できる、ネットワークの場所を指定する。
【0017】
したがって、通話の受信時には、このメディアゲートウェイ105は、この通話の受信によって指定されたディレクトリ番号を判断できる。このディレクトリ番号を、アプリケーション表107を使用して、一つ以上のVXMLスクリプトと一致させることができる。したがって、既に登録されているディレクトリ番号のための電話サービスのVXMLスクリプトの実施の場所またはアドレスを、識別することができる。電話サービスのこのVXMLスクリプトの場所を、セッションマネジャー120に提供することができる。
【0018】
このビーン/スクリプトインターフェース110は、一つのLAN(ローカルエリアネットワーク)を他のLANに接続する、ブリッジサービスもしくはブリッジ機能を備えることができるが、このインターフェース110をメディアゲートウェイ105内に含めることができる。このビーン/スクリプトインターフェース110は、サービスプロセッサ115と、チャネルプロセッサ160や音声インターフェース140などのメディアゲートウェイ105の他の構成要素との間の通信を、促進することができる。このビーン/スクリプトインターフェース110は、ここで記述されるサービスプロセッサ115によって解釈されるような、VXMLスクリプトを介して提供できる機能範囲をサポートするように、構成できる。具体的には、VXMLスクリプトが拡張通話制御およびTCAP(transaction capabilities application part)機能をサポートできるときは、このビーン/スクリプトインターフェース110も、これらの通話制御およびTCAP機能をサポートするように構成できる。この音声インターフェース140は、音声認識と、テキスト音声変換(TTS)機能を提供できる。したがって、トランク通信回線165を介して受信された音声を、テキストに変換でき、テキストデータを、トランク通信回線165を介して一人以上の加入者に提供される、音声ストリームに変換できる。
【0019】
サービスプロセッサ115、セッションマネジャー120、およびVXMLパーサー125を合わせて、分散音声ブラウザの構成要素を提供する。このVXMLパーサー125を、実行時に示し、HTTPサーバ130を介してデータ記憶135からVXMLスクリプトを検索できる。このVXMLパーサー125は、検索されたVXMLスクリプトを、このサーバプロセッサ115にマップでき、かつサーバ115によって解釈できる、中間フォーマットに変換できる。このVXMLスクリプトは、通話許可(Allow Call)、通話ブロック(Block Call)、通話転送(Forward Call)、通話選択的転送(Selective Forward Call)、および通話ブリッジ(Bridge Call)などのTCAP処理を定義する新規タグを含めるように、拡張できることに留意されたい。したがって、VXMLパーサー125も、VXMLスクリプトのいずれの追加拡張タグをも識別するように構成できる。
【0020】
このサービスプロセッサ115は、分散コンピューティング環境内の、同じコンピュータシステム内、または、異なるコンピュータシステム内の、他の構成要素と結合できる、再使用可能なソフトウェア構成要素であることができる。一つのサービスプロセッサ115を、各チャネルのプロセッサ160の実行時に示すことができ、したがって、サービスプロセッサ115を、特定のチャネルプロセッサに関連付けることができる。このサービスプロセッサ115は、解析されたVXMLスクリプトが、このVXMLスクリプトによって指定された電話サービスを実施するための実行環境を提供する、インタープリタとして効果的に働く。したがって、このサービスプロセッサ115は、メディアゲートウェイ105の内部機能を、この電話サービスの解析されたVXMLスクリプト表記と結びつける。従って、このサービスプロセッサ115は、解析されたVXMLスクリプトによって指定されたような電話サービスを実行するために、TTSおよび音声認識機能にアクセスできる。たとえば、テキストおよび認識された音声を、VXMLスクリプト、フォーム、および/または文書のフィールドへ、移植するために使用できる。
【0021】
サービスプロセッサ115およびVXMLパーサー125は、それぞれ、Java(R)仮想マシン145および155内で実行できることに留意されたい。図1は、一つのJava(R)仮想マシン145および155内で実行する複数のサービスプロセッサ115およびVXMLパーサー125を示すが、各サービスプロセッサ115および各VXMLパーサー125は、個々のJava(R)仮想マシン内で実行でき、そのことによって、一つのプログラム内で発生するエラーが他のプログラムに不利な影響を与えるというリスクを最小化することができる。
【0022】
各サービスプロセッサ115および各VXMLパーサー125は、セッションマネジャー120の中に登録できる。したがって、このセッションマネジャー120は、サービスプロセッサ115およびVXMLパーサー125のうちのどれを通話の処理のために使用できるかを追跡できる。このセッションマネジャー120は、さらに、サービスプロセッサ115/VXMLパーサー125の対の動作を調整できる。このセッションマネジャー120は、サービスプロセッサ115とVXMLパーサー125との間の情報を、渡すことができる。具体的に、メディアゲートウェイ105からセッションマネジャー120へ与えられる要求は、着信通話ディレクトリ番号、URL(universal resource locators)を有し電話サービスの一つ以上のVXMLスクリプト表記を指定する一つ以上のURI(universal resource identifiers)、および、この通話を受信する特定のチャネルプロセッサを表す識別子(ID)を含むことができる。このセッションマネジャー120は、ローカルのデータ記憶に情報を記憶できる。したがって、このセッションマネジャー120は、この受信URIを提供することができる、空きVXMLパーサー125を決定できる。さらに、VXMLパーサー125で得られた結果を、記憶されたURI、着信通話ディレクトリ番号、およびチャネルプロセッサIDに従って、適切なサービスプロセッサ115へ戻すことができる。
【0023】
サービスプロセッサ115と、VXMLパーサー125を伴う場合には、複数のセッションマネジャー120は、一つのJava(R)仮想マシン内で実行でき、あるいは、各セッションマネジャー120は、個々のJava(R)仮想マシン内で実行できる。どの場合にも、前述したように、このサービスプロセッサ115、セッションマネジャー120、およびVXMLパーサー125は、コンピューティングネットワークを介して分散された、別々のコンピューティングマシン内に存在することができる。さらに、増大した処理の負荷をサポートするために、必要に応じて、これらのさまざまな構成要素を複製できる。その結果、サービスプロセッサ115、セッションマネジャー120、およびVXMLパーサー125を合わせて、多量のシステム要求をサポートするために調整できる、分散音声ブラウザアーキテクチャを提供する。
【0024】
キャッシュメモリ170を、このセッションマネジャー120とこのVXMLパーサー125との間に配置できる。このキャッシュメモリ170は、多数のフェッチングを低減し、頻繁に使用されるVXMLスクリプトを解析することによって、システム性能を上げることができる。本明細書で開示の発明構成によって、さらに、一つ以上のファイアウォール175、180、185を備えることができる。ファイアウォールは、本明細書で開示するようなシステム100の動作には必要ではないけれども、ファイアウォールの追加によって追加のネットワークセキュリティが提供される。具体的には、ファイアウォール175と180によって、多くの通信会社によって要求される、2重のファイアウォール保護が提供される。ファイアウォール185によって、VXMLパーサー125を、企業または他のプライベートネットワークから分離する機能が提供できる。
【0025】
図2は、図1のシステムによって行われるような、電話サービスの特徴を実施する方法200を示すフローチャートである。この方法200は、図1のシステムが、メディアゲートウェイの各チャネルプロセッサ用の少なくとも一つのサービスプロセッサに示された場合に、開始できる。さらに、VXMLパーサーなどの一つ以上のパーサーを、このサービスプロセッサおよびパーサーが、セッションマネジャーの中に登録されるように、示すことができる。このサービスプロセッサおよびこのパーサーとの間の、一対一の対応は、必要でないことに留意されたい。どのイベントにおいても、電話交換機が通話を受信できる。電話交換機は、メディアゲートウェイの空きチャネルプロセッサを選択でき、および、通話を受信するために、たとえばインバンド・シグナリングまたはISDNのDチャネルを使用して、メディアゲートウェイを照会できる。このメディアゲートウェイが通話を受信したことに応答して、この電話交換機は、この通話を、選択したチャネルプロセッサに適用できる。したがって、ステップ205で、この通話を、メディアゲートウェイによって識別できる。ステップ210で、受信した通話の着信通話ディレクトリ番号を決定できる。
【0026】
ステップ215で、この決定されたディレクトリ番号と関連する、一つ以上の通話処理スクリプトを識別できる。たとえば、着信通話ディレクトリ番号、および、関連するVXMLスクリプトのリスティングを調べ、既に登録されているこのディレクトリ番号のための、特定の通話処理スクリプト、または、電話サービスのVXMLスクリプト表記を決定できる。ステップ220で、このメディアゲートウェイは、TCP/IP接続を介して、セッションマネジャーへ、少なくとも以下の情報を送付できる。その情報は、着信通話ディレクトリ番号、既に登録されているこのディレクトリ番号のための電話サービスの通話処理スクリプト表記を指定する一つ以上のURI、および、この通話を受信する特定のチャネルプロセッサを表す識別子(ID)である。
【0027】
使用可能なパーサーにこのURIを送信する前に、ステップ225に示すように、このセッションマネジャーは、TCP/IP接続を介して、キャッシュメモリに照会し、URIによって指定された通話処理スクリプトがキャッシュメモリ内に含まれているか否かを判断できる。含まれている場合は、この通話処理スクリプトは、パーサーによって既に解析され、サービスプロセッサにマップする中間フォーマットの形で存在する。したがって、この解析された通話処理スクリプトは、ステップ230で、キャッシュメモリから検索でき、この方法は、ステップ250に進むことができる。しかし、このキャッシュメモリが、URIによって指定された通話処理スクリプトを含んでいない場合は、この方法はステップ235に進むことができる。
【0028】
ステップ235で、このセッションマネジャーは、使用可能なパーサーを識別し、このパーサーへ、TCP/IP接続を介して、URIを提供できる。このセッションマネジャーは、このチャネルプロセッサのIDのローカルコピーを、記憶できることに留意されたい。ステップ240で、このパーサーは、HTTPサーバへHTTP要求を発行し、このURIによって指定された通話処理スクリプトを検索できる。この通話処理スクリプトは、たとえば、VXML文書、VXMLテキスト、VXMLスクリプト、および、音声の選択された部分などの、音声マークアップ言語スクリプトを含むことができる。ステップ245で、このパーサーは、要求された通話処理スクリプトを、HTTP接続を介して、受信することができる。次いで、このパーサーは、この通話処理スクリプトを解析し、この通話処理スクリプトを、サービスプロセッサによって解釈できる中間フォーマットに変換できる。
【0029】
ステップ250で、解析された通話処理スクリプトを、このパーサーから、セッションマネジャーへ、TCP/IP接続を介して、送信することができる。このチャネルプロセッサのIDを保持しているセッションマネジャーは、ステップ255で、この通話を受信したチャネルプロセッサと関連付けられたサービスプロセッサ(スクリプト/ビーン)を識別できる。ステップ260で、このセッションマネジャーは、この解析された通話処理スクリプトを、識別されたサービスプロセッサへ転送できる。したがって、このサービスプロセッサは、解析された通話処理スクリプトを実行することによって、電話サービスを実施できる。ステップ265で、このサービスプロセッサは、メディアゲートウェイの音声プロセッサのような要求されたいずれの機能にも、この電話サービスを実施するためのビーン/スクリプトインターフェースを介して、アクセスできる。
【0030】
本明細書で開示の発明は、音声ブラウザをいくつかの構成要素に区分けすることにより、音声ブラウザの拡張性と、性能を高める解決策を提供する。たとえば、この音声ブラウザを、解析、セッション管理およびサービス実現の処理のそれぞれを、別々のコンピューティングマシン上に配置し、および実行することができるように、別々の構成要素に区分けできる。さらに、この音声ブラウザアーキテクチャのさまざまな構成要素は、必要に応じて複製でき、本発明によって、増大した通話量をサポートすることができ、また、拡張可能な音声ブラウザの解決策を提供する。
【0031】
本発明は、ハードウェア、ソフトウェア、または、ハードウェアとソフトウェアの組み合わせの形で実現できる。本発明は、一つのコンピュータシステム内の集約形式で実現でき、あるいは、異なる構成要素がいくつかの相互接続されたコンピュータシステムにわたって展開されている、分散形式で実現できる。いずれの種類のコンピュータシステムも、または、本明細書で記述の方法を実行するために適した他の装置が、本発明に適している。ハードウェアとソフトウェアの典型的な組み合わせは、ロードや、実行時に、本明細書で記述の方法を成し遂げるようにコンピュータシステムを制御するコンピュータプログラムをもつ、汎用目的のコンピュータシステムであることができる。
【0032】
本発明は、また、本明細書で記述の方法の実施を可能にする全ての特徴を備えており、コンピュータシステムにロードされると、前述した方法を成し遂げることが可能である、コンピュータプログラム製品に組み込むこともできる。本明細書のコンピュータプログラムとは、いずれの言語における、命令の組のコードもしくは表記であって、情報処理能力を有するシステムが、特定の機能を、直接、もしくは、a)他の言語、コードもしくは表記に変換、b)異なるマテリアルフォームの形の再生成、の一方もしくは両方の後に、実行させる、すべての表現を意味する。
【0033】
本発明は、本発明の主旨もしくは本質的特性から外れることなく他の形式で具体化できる。したがって、本発明の範囲は、前述した詳細な説明ではなく、特許請求の範囲に示している。
【図面の簡単な説明】
【図1】本明細書で開示の構成に従った分散音声ブラウザを示す概略図である。
【図2】図1の分散音声ブラウザの動作方法を示すフローチャートである。
Claims (25)
- 分散音声ブラウザを使用して、通話を処理する方法であって、
解析された音声マークアップ言語データを解釈するように構成された、複数のサービスプロセッサを配置するステップと、
電話サービスを表す音声マークアップ言語データを検索しおよび解析するように構成された、複数の音声マークアップ言語パーサーを配置するステップと、
少なくとも一つのセッションマネジャーの中に、前記複数のサービスプロセッサ、および、前記複数のマークアップ言語パーサーを登録するステップと、
受信した電話サービス要求の構成要素を、前記音声マークアップ言語パーサーに振り分け、前記解析された音声マークアップ言語データを、前記サービスプロセッサに振り分け、そのことにより、前記電話サービスを実施するステップと、を含む方法。 - 電話サービス要求を受信するステップを更に含み、前記電話サービス要求は、前記サービスプロセッサの特定の一つと関連付けられており、かつ前記電話サービスを表す前記音声マークアップ言語データの位置を指定するものである、請求項1に記載の方法。
- 使用可能な音声マークアップ言語パーサーを決定するステップと、
前記使用可能な音声マークアップ言語パーサーに、前記指定した位置を提供するステップと、
をさらに含む、請求項2に記載の方法。 - 前記指定した位置から前記音声マークアップ言語データを検索するステップと、
前記音声マークアップ言語データを中間フォーマットに変換するために、前記音声マークアップ言語データを解析するステップと、
をさらに含む、請求項3に記載の方法。 - 前記解析された音声マークアップ言語データを受信するステップと、
前記関連付けられたサービスプロセッサに、前記解析された音声マークアップ言語データを提供するステップと、
をさらに含む、請求項4に記載の方法。 - 前記解析された音声マークアップ言語データを実行して、前記電話サービスを実施するステップをさらに含む、請求項5に記載の方法。
- 前記サービスプロセッサ、前記音声マークアップ言語パーサー、および、前記セッションマネジャーを、追加的に複製するステップとをさらに含む、請求項1に記載の方法。
- 前記複数のサービスプロセッサを、少なくとも一つの仮想マシン内に示し、前記複数の音声マークアップ言語パーサーを、前記複数のサービスプロセッサ用の前記少なくとも一つの仮想マシンとは別の、少なくとも一つの仮想マシン内に示すステップとをさらに含む、請求項1に記載の方法。
- 前記複数のサービスプロセッサを、少なくとも第1のコンピューティングマシン内に、前記複数の音声マークアップ言語パーサーを少なくとも第2のコンピューティングマシン内に、前記セッションマネジャーを少なくとも第3のコンピューティングマシン内に配置するステップであって、前記第1、前記第2、および、前記第3のコンピューティングマシンを、ネットワークを介して通信可能なようにリンクするステップをさらに含む、請求項7に記載の方法。
- 電話サービスの音声マークアップ言語表記を、検索し、解析するように構成された解析の構成要素と、
前記電話サービスの前記解析された音声マークアップ言語表記を解釈するための、実行環境を提供するように構成された電話サービス実現の構成要素と、
前記解析の構成要素、および、前記電話サービス実現の構成要素の動作を、調整するように構成されたセッション管理の構成要素と、
を含む分散音声ブラウザシステム。 - 前記解析の構成要素が、複数の音声マークアップ言語パーサーをさらに含む、請求項10に記載のシステム。
- 前記電話サービスの構成要素が、複数のサービスプロセッサを含む、請求項11に記載のシステム。
- 前記セッション管理の構成要素が、複数のセッションマネジャーを含む、請求項12に記載のシステム。
- 前記音声マークアップ言語パーサーが、少なくとも一つの仮想マシン内で実行するように構成される、請求項13に記載のシステム。
- 前記サービスプロセッサが、前記一つの音声マークアップ言語パーサー用の前記少なくとも一つの仮想マシンと独立している、少なくとも一つの仮想マシン内で実行するように構成される、請求項14に記載のシステム。
- 前記解析の構成要素、前記セッション管理の構成要素、および、前記電話サービス実現の構成要素が、別々のコンピューティングマシン内で実行する、請求項10に記載のシステム。
- マシンによって実行可能の複数のコードセクションをもつコンピュータプログラムを記憶したコンピュータ可読記憶であって、前記コンピュータプログラムが、
解析された音声マークアップ言語データを解釈するように構成された、複数のサービスプロセッサを配置するステップと、
電話サービスを表す音声マークアップ言語データを、検索し、解析するように、構成された、複数の音声マークアップ言語パーサーを配置するステップと、
少なくとも一つのセッションマネジャーに、前記複数のサービスプロセッサ、および、前記複数のマークアップ言語パーサーを、登録するステップと、
受信した電話サービス要求の構成要素を、前記音声マークアップ言語パーサーに振り分け、前記解析された音声マークアップ言語データを前記サービスプロセッサに振り分けるステップであって、そのことにより前記電話サービスを実施するステップと、
をコンピュータに実行させるためのものである、コンピュータ可読記憶装置。 - 電話サービス要求を、前記サービスプロセッサの特定の一つと関連付け、前記電話サービスを表す前記音声マークアップ言語データの位置を指定する、前記電話サービス要求を受信するステップをさらに含む、請求項17に記載のコンピュータ可読記憶装置。
- 使用可能な音声マークアップ言語パーサーを、決定するステップと、
前記使用可能な音声マークアップ言語パーサーに、前記指定された位置を提供するステップと、
をさらに含む、請求項18に記載のコンピュータ可読記憶装置。 - 前記指定された位置から前記音声マークアップ言語データを検索するステップと、
前記音声マークアップ言語データを解析し、前記音声マークアップ言語データを中間フォーマットに変換するステップと、
をさらに含む、請求項19に記載のコンピュータ可読記憶装置。 - 前記解析された音声マークアップ言語データを検索するステップと、
前記解析された音声マークアップ言語データを、前記関連付けられたサービスプロセッサに提供するステップと、
をさらに含む、請求項20に記載のコンピュータ可読記憶装置。 - 前記解析された音声マークアップ言語データを実行し、前記電話サービスを実施するステップをさらに含む、請求項21に記載のコンピュータ可読記憶装置。
- 前記サービスプロセッサ、前記音声マークアップ言語パーサー、および、前記セッションマネジャーを、追加的に複製するステップをさらに含む、請求項17に記載のコンピュータ可読記憶装置。
- 少なくとも一つの仮想マシン内に、前記複数のサービスプロセッサを配置し、前記複数のサービスプロセッサ用の前記少なくとも一つの仮想マシンとは別の、少なくとも一つの仮想マシン内に、前記複数の音声マークアップ言語パーサーを配置するステップをさらに含む、請求項17に記載のコンピュータ可読記憶装置。
- 前記複数のサービスプロセッサを、少なくとも第1のコンピューティングマシン内に配置し、前記複数の音声マークアップ言語パーサーを、少なくとも第2のコンピューティングマシン内に配置し、前記セッションマネジャーを、少なくとも第3のコンピューティングマシン内に配置するステップを有し、前記第1、前記第2、および前記第3のコンピューティングマシンが、ネットワークを介して通信可能なようにリンクされている、
請求項24に記載のコンピュータ可読記憶装置。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/172,279 US8000970B2 (en) | 2002-06-14 | 2002-06-14 | Distributed voice browser |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004032742A true JP2004032742A (ja) | 2004-01-29 |
JP4446022B2 JP4446022B2 (ja) | 2010-04-07 |
Family
ID=29733013
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003157484A Expired - Fee Related JP4446022B2 (ja) | 2002-06-14 | 2003-06-03 | 分散音声ブラウザを使用して通話を処理する方法および装置 |
Country Status (2)
Country | Link |
---|---|
US (2) | US8000970B2 (ja) |
JP (1) | JP4446022B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008505553A (ja) * | 2004-06-30 | 2008-02-21 | グレネイル エレクトロニクス インコーポレイテッド | 分散型カスタマイズ可能ボイスメールシステム |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1524832A1 (en) * | 2003-10-17 | 2005-04-20 | Hewlett-Packard Development Company, L.P. | Voice mark-up language having an application transfer tag and interpreter therefore |
US7831656B2 (en) * | 2004-12-29 | 2010-11-09 | International Business Machines Corporation | Effortless association between services in a communication system and methods thereof |
US7409344B2 (en) * | 2005-03-08 | 2008-08-05 | Sap Aktiengesellschaft | XML based architecture for controlling user interfaces with contextual voice commands |
US9313307B2 (en) * | 2005-09-01 | 2016-04-12 | Xtone Networks, Inc. | System and method for verifying the identity of a user by voiceprint analysis |
US20100158217A1 (en) | 2005-09-01 | 2010-06-24 | Vishal Dhawan | System and method for placing telephone calls using a distributed voice application execution system architecture |
US9456068B2 (en) * | 2005-09-01 | 2016-09-27 | Xtone, Inc. | System and method for connecting a user to business services |
US11102342B2 (en) | 2005-09-01 | 2021-08-24 | Xtone, Inc. | System and method for displaying the history of a user's interaction with a voice application |
US9426269B2 (en) * | 2005-09-01 | 2016-08-23 | Xtone Networks, Inc. | System and method for performing certain actions based upon a dialed telephone number |
US8964960B2 (en) * | 2005-09-01 | 2015-02-24 | Xtone Networks, Inc. | System and method for interacting with a user via a variable volume and variable tone audio prompt |
US9799039B2 (en) | 2005-09-01 | 2017-10-24 | Xtone, Inc. | System and method for providing television programming recommendations and for automated tuning and recordation of television programs |
US11153425B2 (en) * | 2005-09-01 | 2021-10-19 | Xtone, Inc. | System and method for providing interactive services |
US20100166161A1 (en) * | 2005-09-01 | 2010-07-01 | Vishal Dhawan | System and methods for providing voice messaging services |
WO2007028128A2 (en) * | 2005-09-01 | 2007-03-08 | Vishal Dhawan | Voice application network platform |
US9253301B2 (en) * | 2005-09-01 | 2016-02-02 | Xtone Networks, Inc. | System and method for announcing and routing incoming telephone calls using a distributed voice application execution system architecture |
US7644000B1 (en) * | 2005-12-29 | 2010-01-05 | Tellme Networks, Inc. | Adding audio effects to spoken utterance |
GB2564395B (en) | 2017-07-06 | 2020-04-29 | Metaswitch Networks Ltd | Media gateway |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1994000945A1 (en) | 1992-06-25 | 1994-01-06 | Teledata Solutions, Inc. | Call distributor |
US5541986A (en) | 1993-07-27 | 1996-07-30 | Bell Communications Research, Inc. | Method and system for automated telecommunications service script consolidation and downloading |
US5724406A (en) | 1994-03-22 | 1998-03-03 | Ericsson Messaging Systems, Inc. | Call processing system and method for providing a variety of messaging services |
FI943609A (fi) * | 1994-08-03 | 1996-02-04 | Nokia Telecommunications Oy | Menetelmä kanavan allokoimiseksi solukkoradiojärjestelmässä |
US6091954A (en) * | 1994-09-01 | 2000-07-18 | Telefonaktiebolaget Lm Ericsson | Channel assignment in enhanced fixed-plan mobile communications systems |
US6088749A (en) | 1995-11-30 | 2000-07-11 | Excel Switching Corp. | Universal API with generic call processing message having user-defined PPL event ID and generic response message for communications between telecommunications switch and host application |
US5721729A (en) | 1996-01-24 | 1998-02-24 | Klingman; Edwin E. | Universal input call processing system |
US6272538B1 (en) | 1996-07-30 | 2001-08-07 | Micron Technology, Inc. | Method and system for establishing a security perimeter in computer networks |
US6091808A (en) | 1996-10-17 | 2000-07-18 | Nortel Networks Corporation | Methods of and apparatus for providing telephone call control and information |
US6002673A (en) * | 1997-03-21 | 1999-12-14 | Lucent Technologies Inc. | Method for channel management in a TDMA communication system |
US6418461B1 (en) | 1997-10-06 | 2002-07-09 | Mci Communications Corporation | Intelligent call switching node in an intelligent distributed network architecture |
US6175619B1 (en) | 1998-07-08 | 2001-01-16 | At&T Corp. | Anonymous voice communication using on-line controls |
US6134313A (en) | 1998-10-23 | 2000-10-17 | Toshiba America Information Systems, Inc. | Software architecture for a computer telephony system |
US6625134B1 (en) * | 1998-11-09 | 2003-09-23 | Samsung Electronics Co., Ltd. | System and method for reallocating a traffic channel in soft handoff state |
US6707889B1 (en) * | 1999-08-24 | 2004-03-16 | Microstrategy Incorporated | Multiple voice network access provider system and method |
WO2001052514A2 (en) * | 2000-01-07 | 2001-07-19 | Informio, Inc. | Methods and apparatus for an audio web retrieval telephone system |
US6922411B1 (en) * | 2000-09-29 | 2005-07-26 | Voxeo Corporation | Networked computer telephony system driven by web-based applications |
US6785707B2 (en) * | 2000-11-14 | 2004-08-31 | Bitfone Corp. | Enhanced multimedia mobile content delivery and message system using cache management |
FI111599B (fi) * | 2000-12-28 | 2003-08-15 | Nokia Corp | Menetelmä ja järjestelmä matkaviestintään |
US20020087325A1 (en) * | 2000-12-29 | 2002-07-04 | Lee Victor Wai Leung | Dialogue application computer platform |
US6891932B2 (en) * | 2001-12-11 | 2005-05-10 | Cisco Technology, Inc. | System and methodology for voice activated access to multiple data sources and voice repositories in a single session |
-
2002
- 2002-06-14 US US10/172,279 patent/US8000970B2/en not_active Expired - Fee Related
-
2003
- 2003-06-03 JP JP2003157484A patent/JP4446022B2/ja not_active Expired - Fee Related
-
2011
- 2011-07-26 US US13/190,538 patent/US8170881B2/en not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008505553A (ja) * | 2004-06-30 | 2008-02-21 | グレネイル エレクトロニクス インコーポレイテッド | 分散型カスタマイズ可能ボイスメールシステム |
Also Published As
Publication number | Publication date |
---|---|
US20030233238A1 (en) | 2003-12-18 |
US8000970B2 (en) | 2011-08-16 |
US8170881B2 (en) | 2012-05-01 |
US20110282672A1 (en) | 2011-11-17 |
JP4446022B2 (ja) | 2010-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8170881B2 (en) | Distributed voice browser | |
US6922411B1 (en) | Networked computer telephony system driven by web-based applications | |
KR100870294B1 (ko) | 패킷 전화통신망 내에서 호 처리를 구현하는 방법 및 장치 | |
US7058164B1 (en) | Externally interrupting a communication session | |
US20040071275A1 (en) | Telephone call handling solution in an interactive voice response system | |
WO2001024025A1 (en) | Method and apparatus for data-linking a mobile knowledge worker to home communication-center infrastructure | |
US8364490B2 (en) | Voice browser with integrated TCAP and ISUP interfaces | |
US20040109541A1 (en) | Telephony voice server | |
US7266182B2 (en) | Method and system for implementing a telephony services feature using voice XML | |
US7085821B2 (en) | TCAP event processing environment | |
JP4238212B2 (ja) | シグナリング・イベントのためのサービス論理コンテキスト・キャッシュ | |
US7072957B2 (en) | Remote administration and monitoring of a service component in a service logic execution environment | |
US8149999B1 (en) | Generating reference variations | |
US20050249191A1 (en) | CCXML/Voice XML browser to implement an AIN intelligent peripheral with call handling functionality | |
JP4747957B2 (ja) | 接続制御装置及び接続制御方法並びにプログラム | |
KR20030057005A (ko) | 음성 포탈 시스템에서의 검색 및 문서 변환 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070502 |
|
RD12 | Notification of acceptance of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7432 Effective date: 20070502 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20070507 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080729 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080903 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090908 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20090930 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091001 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130129 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4446022 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130129 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |