JP4514723B2 - 対話型音声応答システムにおける動的ビデオ生成 - Google Patents

対話型音声応答システムにおける動的ビデオ生成 Download PDF

Info

Publication number
JP4514723B2
JP4514723B2 JP2006065467A JP2006065467A JP4514723B2 JP 4514723 B2 JP4514723 B2 JP 4514723B2 JP 2006065467 A JP2006065467 A JP 2006065467A JP 2006065467 A JP2006065467 A JP 2006065467A JP 4514723 B2 JP4514723 B2 JP 4514723B2
Authority
JP
Japan
Prior art keywords
voice response
interactive voice
response system
generating
communication terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006065467A
Other languages
English (en)
Other versions
JP2006254463A (ja
Inventor
ウィリアム アーハート ジョージ
シー.マテュラ ヴァレンティー
ジョセフ スキバ デヴィット
Original Assignee
アバイア テクノロジー エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アバイア テクノロジー エルエルシー filed Critical アバイア テクノロジー エルエルシー
Publication of JP2006254463A publication Critical patent/JP2006254463A/ja
Application granted granted Critical
Publication of JP4514723B2 publication Critical patent/JP4514723B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/50Telephonic communication in combination with video communication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/25Aspects of automatic or semi-automatic exchanges related to user interface aspects of the telephonic communication service
    • H04M2203/251Aspects of automatic or semi-automatic exchanges related to user interface aspects of the telephonic communication service where a voice mode or a visual mode can be used interchangeably
    • H04M2203/253Aspects of automatic or semi-automatic exchanges related to user interface aspects of the telephonic communication service where a voice mode or a visual mode can be used interchangeably where a visual mode is used instead of a voice mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/42314Systems providing special services or facilities to subscribers in private branch exchanges

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)

Description

本発明は、一般に、遠隔通信に関し、より詳細には、対話型音声応答(IVR)システムにおけるビデオ・コンテンツの生成に関する。
多くの企業が、通信端末からのコール(呼)を取り扱う対話型音声応答(IVR)システムを利用している。対話型音声応答システムは、通常、発呼者にメニューの階層を提示し、メニューを操作し情報をIVRシステムに提供するための入力を発呼者に促す。例えば、発呼者は、メニュー内の3番目のオプションを選ぶために、その端末のキーパッドのキー「3」を押すか、または「3」という語を言うことができる。同様に、発呼者は、キーパッドによって数字を入力することによって、または数字を言うことによって、対話型音声応答システムに、発呼者の銀行口座番号を指定することができる。多くの対話型音声応答システムでは、発呼者は、該当するメニュー・オプションを選択することによって、または、その人物に関連する内線電話の番号を入力することによって、企業内の人物に接続することができる。
図1は、従来技術による通信システム100を示す。通信システム100は、図示のように相互接続された、通信ネットワーク105、構内交換機(PBX)110、および対話型音声応答システム120を含む。
通信ネットワーク105は、通信端末(例えば、電話、携帯情報端末[PDA]など)からのコールを構内交換機110に搬送する、公衆交換電話網[PSTN]やインターネットなどのネットワークである。コール(呼)は、従来の音声電話コール、テキスト・ベースのインスタント・メッセージ(IM)セッション、VoIP(ボイス・オーバ・インターネット・プロトコル)などでありうる。
構内交換機110は、通信ネットワーク105から着呼を受け取り、そのコール(呼)を、相応なように、対話型音声応答(IVR)システム120、または、企業内の複数の通信端末の1つに向けて送る。構内交換機110はまた、アウトバウンド信号を、企業内の通信端末、および対話型音声応答システム120から受け取り、その信号を発呼者の端末に送達するために通信ネットワーク105上に送信する。
上述のように、対話型音声応答システム120は、発呼者に1つまたは複数のメニューを提示し、また、構内交換機110を介して発呼者からの入力(例えば、音声信号、キーパッド入力など)を受け取る、データ処理システムである。対話型音声応答システム120は、1つまたは複数のアプリケーションをホストすること、アプリケーションにコマンドを提出すること、発呼者の入力をアプリケーションに転送すること、および、アプリケーションから出力を受け取ることができる。いくつかの実施形態では、対話型音声応答システム120は、ソフトウェア・アプリケーションをホストする汎用サーバとすることができ、他のいくつかの実施形態では、対話型音声応答システム120は、アプリケーションがハードウェアに実装される「装置」(例えば、フィールド・プログラマブル・ゲートアレイ[FPGA]、特定用途向け集積回路[ASIC]など)とすることができる。
ビデオ・ディスプレイが通信端末において広く普及すると、これは、対話型音声応答(IVR)システムから端末で受け取られるオーディオ・コンテンツに、関連のビデオ・コンテンツが伴う場合に有利となるであろう。例えば、対話型音声応答システムの合成音声によって「発話された」メニュー・オプションを、テキストとして表示することもできる。しかし、携帯通信端末のビデオ・ディスプレイは、サイズが限られているため、対話型音声応答システムによって発話されたオーディオ・コンテンツのテキスト版を提供することには問題があるおそれがある。例えば、「あなたの月次明細書の左上の角の黄色の枠に見られる12桁の口座番号を音声またはタイプで入力してください」に相当するテキストを、ユーザが読み取り理解するのは、より小さいビデオ・ディスプレイでは特に面倒となる。したがって、ユーザの端末上でコンパクトかつ整然となるように、したがって、より容易に読み取り理解できるように、ビデオ・コンテンツ、特にテキストが生成されると有利となるであろう。さらに、(例えば、ソフトウェア開発者、ウェブページ・コンテンツ制作者などによる)手作業の人間の労力を必要とせずに、自動的に対話型音声応答システムによってそのようなビデオ・コンテンツの生成が行われると特に有利となるであろう。
本発明の例示的な実施形態では、対話型音声応答(IVR)システムが、生成されたオーディオ・コンテンツに伴うようにビデオ・コンテンツを生成し、この場合、ビデオ・コンテンツは、IVRシステムの状態、発呼側通信端末のビデオ表示容量、および、端末を介してユーザによって提供される情報に基づく。例示的な実施形態では、オーディオ・コンテンツが生成された元のテキストに基づいて、ビデオ・コンテンツを生成する。詳細には、ビデオ・コンテンツは、このテキストの、通信端末で表示するために適切な簡略版を含む。例示的な実施形態では、このテキストの簡略版は、統語および意味処理を介して生成される。さらに、ユーザが提供した情報の簡略版が生成され、ビデオ・コンテンツに組み込まれる。
例示的な実施形態は、対話型音声応答システムおよび通信端末を必要とするコール中にビデオ・コンテンツを生成することを含み、このビデオ・コンテンツは、(i)対話型音声応答システムの状態、および(ii)通信端末のビデオ表示容量に基づく。
以下に示す用語には、本明細書および添付の特許請求の範囲で使用するために次の定義が与えられる。
本明細書および特許請求では、用語「コール(call)」は、1または複数の通信端末ユーザを必要とする対話型通信として定義される。コールは、従来の音声電話コール、インスタント・メッセージ(IM)セッション、ビデオ会議などでありうる。
本明細書および特許請求では、用語「ビデオ表示容量」は、ビデオ・ディスプレイでユーザに読み取り理解できるようにレンダリングすることができる情報(例えば、テキスト、アイコンなど)の量として定義される。当業者には理解されるように、ビデオ表示容量は、ビデオ・ディスプレイの物理的サイズ、ビデオ・ディスプレイの解像度、ビデオ・ディスプレイにテキストをレンダリングするために使用可能なフォントおよびフォント・サイズ、および、ビデオ・ディスプレイの色機能などに基づく。
図2は、本発明の例示的な実施形態による、通信システム200を示す。図2に示すように、通信システム200は、従来技術の対話型音声応答(IVR)システム120が、対話型音声応答(IVR)システム220で置き換えられたことを除いて、通信システム100と同じである。
対話型音声応答(IVR)システム220は、対話型音声応答(IVR)システム120のすべての機能に加えて、後で図5から図9に関連して説明される追加の機能を有する。詳細には、この追加の機能は、以下の能力、すなわち、VoIP(ボイス・オーバ・インターネット・プロトコル)パケットの受信、送信、および処理、VXML(ボイス拡張マークアップ言語)ドキュメント(VXMLは後で図3に関連し説明される)に関連付けられた格納および処理、自然言語の統語および意味処理、ならびに、ビデオ・コンテンツの生成および送信の能力を含む。
XMLと略される拡張マークアップ言語は、カスタム・タグの作成を可能にする仕様であり、カスタム・タグは、2つのアプリケーションや組織などの間のデータの定義、伝送、検証、および解釈を可能にする。(voiceXMLまたはVXMLと略される)ボイス拡張マークアップ言語は、XML(拡張マークアップ言語)のアプリケーションであり、合成音声を特徴とするダイアログ、デジタル化されたオーディオ、音声入力およびキー入力の認識、音声入力の記録、および、電話通信を可能にする。VXMLの主目的は、対話型音声応答システム・アプリケーションに、ウェブ・ベースの開発、およびコンテンツの送達の利点をもたらすことである。
図3は、本発明の例示的な実施形態による例示的なVXML(ボイス拡張マークアップ言語)ドキュメントを示す。このVXMLドキュメントは、ユーザの記録を取り出すための2つのオプションを有するメニューを提示し、第1のオプションは、ユーザが、自身の社会保障番号を入力することによってユーザ自身を識別することを可能にし、第2のオプションは、ユーザが、自身の口座番号を識別することを可能にする。<prompt>タグと<prompt/>タグの間のテキストは、このメニューのためのオーディオ・コンテンツ(すなわち合成音声)を生成するために使用される。
図4は、本発明の例示的な実施形態による、通信端末で表示される例示的なビデオ・コンテンツを示す。図4のビデオ・コンテンツは、図3に示されているVXMLドキュメントのメニューに対応する。図4に示されるように、テキストをその本質的要素にまで減らし、また省略形を用いることによって、プロンプト・タグのテキストが、端末で表示するために大幅に簡略化されている。例示的な実施形態が、このようなビデオ・コンテンツをVXMLドキュメントから生成する方法は、後で図5から図7に関連し説明される。
図5は、本発明の例示的な実施形態による対話型音声応答(IVR)システム220の主要なタスクの流れ図を示す。図5に示されるどのタスクが、同時または図示とは異なる順序に実行されうるかは、当業者には明らかであろう。
タスク501で、対話型音声応答(IVR)システム220は、周知の方法で、通信ネットワーク105および構内交換機(PBX)110を介して、通信端末からコールを受け取る。
タスク502で、対話型音声応答(IVR)システム220は、発呼側端末のビデオ表示容量を決定する。例示的な実施形態では、ビデオ表示容量は、VoIPセッション開始プロトコル(SIP)を介して決定され、これは、セッションを確立しているとき、発呼装置の端末タイプに関する情報を伝達する。
タスク503で、対話型音声応答(IVR)システム220は、それの現在の状態を、それの前の状態と、(もしあれば)ユーザ入力と、直近の状態の変化からの経過時間とに基づいて決定する。
タスク504では、タスク503で決定された現在の状態が状態の変化に相当するかどうかを確認し、相当する場合、タスク505に実行が進み、そうでない場合、タスク503に戻る。
タスク505で、対話型音声応答(IVR)システム220は、その現在の状態に基づいて、周知の方法で、適切なVXMLドキュメント要素を取り出す。本発明の例示的な実施形態では、このような要素は、メニュー・プロンプト、および、(後で図7に関連し説明される)メニュー・プロンプトの内容を構文解析するための文法などを含むことができる。
タスク506で、対話型音声応答(IVR)システム220は、周知の方法で、タスク505のVXMLドキュメント要素と、もしあればユーザが指定した情報(例えば、社会保障番号など)に従って、オーディオ・コンテンツ(例えば、合成音声など)を生成する。
タスク507で、対話型音声応答(IVR)システム220は、(指定された場合、文法を含む)タスク505のVXML要素、発呼側端末のビデオ表示容量、ユーザが指定した情報、および、現在の状態のままでいる時間の推定値に基づいて、ビデオ・コンテンツを生成する。タスク507は、後で図6および7に関連し詳細に説明される。
タスク507が完了した後、実行はタスク503にループして戻る。
図6は、本発明の例示的な実施形態による、タスク507の詳細な流れ図を示す。図6に示されるどのタスクが、同時または図示とは異なる順序に実行されうるかは、当業者には明らかであろう。
タスク601で、対話型音声応答(IVR)システム220は、変数Sを、タスク505のVXML要素とユーザが指定した情報とを含むテキスト文字列のセットに初期化する。
タスク602で、対話型音声応答(IVR)システム220は、セットSのテキスト文字列の簡略版のセットS’を生成する。タスク602は、後で図7に関連し詳細に説明される。
タスク603で、対話型音声応答(IVR)システム220は、セットSのサイズ、およびユーザ入力のタイムアウトの長さなどのファクタによって決定することができる、発呼側端末のビデオ表示容量、および現在の状態のままでいる時間の推定値に基づいて、1つまたは複数の非空のサブセットにセットS’を分割する。S’をサブセットに分割することにより、発呼側端末のビデオ・ディスプレイにその全体が入るには長すぎるテキスト・ブロックの互い違いの提示が可能になる(例えば、メニューの1〜4のオプションを5秒間表示し、次いで画面をクリアしてメニューのオプション5〜7を表示する)。
タスク604で、対話型音声応答(IVR)システム220は、周知の方法で、サブセットS’に基づいてビデオ・コンテンツを生成する。タスク604が完了した後、実行はループしてタスク503に戻る。
図7は、本発明の例示的な実施形態による、タスク602の詳細な流れ図を示す。図7に示されるどのタスクが、同時または図示とは異なる順序に実行されうるかは、当業者には明らかであろう。
タスク701で、対話型音声応答(IVR)システム220は、セットS’を空に初期化する。
タスク702で、対話型音声応答(IVR)システム220は、セットSからテキスト文字列sを選択し除去する。任意の特定のテキスト文字列の選択は、重要でなく、したがって、セットSに使用されるデータ構造に対して可能な最も単純なやり方で実行することができる。
タスク703で、対話型音声応答(IVR)システム220は、テキスト文字列sに統語処理を実行する。当業者には認識されるように、いくつかの実施形態では、統語処理は、文法に基づいてテキスト文字列を構文解析することを含むことができ、他のいくつかの実施形態では、統語処理は、語彙に基づく単純なキーワード検索、または当業者に周知の他のある種の技術を含むことができる。例示的な実施形態では、テキスト文字列は、VXMLドキュメントに指定される文法に基づいて構文解析される。当業者には認識されるように、この文法は、VXMLドキュメントそれ自体の範囲内で定義しても、あるいは、URI(ユニフォーム・リソース識別子)によって指定された外部の文法としてもよい。
タスク704で、対話型音声応答(IVR)システム220は、テキスト文字列sに意味処理を実行する。当業者には認識されるように、セマンティック・インタプリタ、知識ベース・システム、定理証明系(theorem prover)などを含めて、テキストから意味を抽出しテキストについて推論するための当技術分野で知られる多数の技術がある。本発明のいくつかの実施形態では、タスク704が実行されないことがあり、このような実施形態では、タスク703の統語処理は、後述するように、簡略化されたテキスト文字列を生成するための構文ベースのヒューリスティックスと併せて使用されうる。
タスク705で、対話型音声応答(IVR)システム220は、タスク703の統語処理、(実行された場合)タスク704の意味処理、および、発呼側端末のビデオ表示容量に基づいて、テキスト文字列sの簡略版s’を生成する。当業者には認識されるように、言葉の省略形(例えば、電話に対する「tel.」、社会保障番号に対する「SS#」など)は、統語処理が単独で用いられるか意味処理と併せて用いられるかに関わらず、テキスト文字列sを簡略化する1つの方法として使用することができる。統語処理が単独で用いられる場合、キーワードまたはフレーズの検索、ならびに、構文解析された文の目的語のみの使用(例えば、文「あなたの口座番号を言うかまたはタイプ入力してください」は、名詞句「口座番号」にまで減じるなど)などの当技術分野で周知の様々な技術を用いることができる。意味処理も用いられる場合、簡略されたテキスト文字列s’は、テキスト文字列sの意味にも基づいて生成することができる。例えば、ユーザが、モトローラ社のIVRシステムにコールし、「私は、モトローラRazrを買いたい」と言った場合、簡略化された文字列「電話機を買う」が、ユーザの端末に表示されうる(このとき、ユーザは、販売部門に転送される)が、ユーザが、「私は、モトローラ社の100株を買いたい」と言った場合、簡略化された文字列「株を買う」が、ユーザの端末に表示されうる(このとき、ユーザは、投資家向け部門に転送される)。
タスク705が完了した後、タスク603で実行が継続する。
図8は、本発明の例示的な実施形態による、対話型音声応答(IVR)システム220の第1の実装形態の主要な要素を示す。IVRシステム220は、図示のように相互接続された、受信機801、プロセッサ802、メモリ803、および送信機804を含む。
受信機801は、周知の方法で、構内交換機(PBX)110から信号を受け取り、信号に符号化された情報をプロセッサ802に転送する。受信機801をどのように作成し使用するかは、本明細書を読んだ後、当業者には明らかとなろう。
プロセッサ802は、受信機801から情報を受け取ること、メモリ803に格納された(特に、図5から図7のタスクに対応する命令を含む)命令を実行すること、メモリ803からデータを読み取ることおよびそれにデータを書き込みこと、ならびに、送信機804に情報を送信することができる汎用プロセッサである。本発明のいくつかの代替実施形態では、プロセッサ802は、専用プロセッサであってもよい。いずれの場合でも、プロセッサ802をどのように作成し使用するかは、本明細書を読んだ後、当業者には明らかとなろう。
メモリ803は、当技術分野で周知のように、データおよび実行可能命令を格納し、また、メモリ803は、RAM(ランダム・アクセス・メモリ)、フラッシュ・メモリ、ディスク・ドライブ記憶装置などの任意の組合せとすることができる。メモリ803をどのように作成し使用するかは、本明細書を読んだ後、当業者には明らかとなろう。
送信機804は、周知の方法で、プロセッサ802から情報を受け取り、(オーディオおよびビデオ信号を含む)この情報を符号化する信号を、構内交換機(PBX)110に送信する。送信機804をどのように作成し使用するかは、本明細書を読んだ後、当業者には明らかとなろう。
図9は、本発明の例示的な実施形態による、対話型音声応答システム220の第2の実装形態の主要な要素を示す。図9に示されるように、IVRシステム220の第2の実装形態は、複数の「ボックス」(すなわちコンピュータ)および図8で採用されたような「コンポーネント」レベルではなく、「システム」レベルで示されているボックスを含む。
対話型音声応答(IVR)システム220は、図示のように相互接続された、ボイス・ポータル910、ビデオ・サーバ920、およびアプリケーション・サーバ930を含む。
ボイス・ポータル910は、VoIP(ボイス・オーバ・インターネット・プロトコル)オーディオ・ストリームを構内交換機(PBX)110を介して通信端末から受け取り、VoIPオーディオ・コンテンツをPBX110を介して通信端末に送信し、アプリケーション・サーバ930からVXMLドキュメントを受け取り、アプリケーション・サーバ930にVXMLドキュメントを送信し、VXMLコア・サービスおよび処理(例えば、音声認識、音声生成など)を実行し、VXMLアプリケーション状態をビデオ・サーバ920に送信する、サーバにホストされるアプリケーションである。
ビデオ・サーバ920は、VXMLアプリケーション状態をボイス・ポータル910から受け取り、図5から図7の方法に従ってビデオ・コンテンツを生成し、ビデオ・コンテンツを構内交換機(PBX)110を介して通信端末に送信する、サーバである。
アプリケーション・サーバ930は、(例えば、顧客アカウントの記録を取り出すための)1つまたは複数のウェブ・ベース・アプリケーションをホストし、これらのアプリケーションのためのデータを格納し、ボイス・ポータル910からVXMLドキュメントを受け取り、VXMLドキュメントをレンダリングし、VXMLドキュメントをボイス・ポータル910に送信する。
当業者には認識されるように、本発明のいくつかの実施形態では、ボイス・ポータル910、ビデオ・サーバ920、およびアプリケーション・サーバ930のそれぞれを、別個の物理サーバ上とすることができ、他のいくつかの実施形態では、これらのうち2つまたは全部を、共通の物理サーバ上とすることができる。
上記の実施形態は、本発明の例示に過ぎず、本発明の範囲から逸脱することなく、上記の実施形態の多くの変形形態が当業者によって考案されうることは理解されよう。例えば、本明細書では、本発明の例示的な実施形態の綿密な記述および理解を与えるために、多くの特定の細部が示されている。しかし、本発明は、これらの細部の1つまたは複数がなくても実施することができる、あるいは他の方法、材料、構成要素などと共に実施することができることは当業者には認識されよう。
さらに、いくつかの事例では、例示的な実施形態の態様を不明瞭にするのを避けるために、周知の構造、材料、または動作が、詳細に図示もしくは記述されていない。図に示された様々な実施形態は、例示であって、必ずしも原寸に比例して示されていないことは理解されよう。本明細書全体にわたる、「1つの実施形態(one embodiment)」、「実施形態(an embodiment)」、または「いくつかの実施形態(some embodiments)」に対する参照は、実施形態に関連して記述された特定の特徴、構造、材料、または特性が、本発明の必ずしもすべての実施形態ではないが少なくとも1つの実施形態に含まれることを意味している。したがって、本明細書全体にわたる様々な箇所に現われる「1つの実施形態では」、「実施形態では」、または「いくつかの実施形態では」の語句は、必ずしもすべてが同じ実施形態を参照していない。さらに、特定の特徴、構造、材料、または特性は、1つまたは複数の実施形態に任意の適切な態様で組み合せることができる。したがって、このような変形形態は、添付の特許請求の範囲およびその均等物の範囲内に含まれることが意図される。
従来技術による通信システム100を示す図である。 本発明の例示的な実施形態による通信システム200を示す図である。 本発明の例示的な実施形態による例示的なVXML(ボイス拡張マークアップ言語)ドキュメントを示す図である。 本発明の例示的な実施形態による、通信端末で表示される例示的なビデオ・コンテンツを示す図である。 本発明の例示的な実施形態による、図2に示される対話型音声応答システム220の主要なタスクを示す流れ図である。 本発明の例示的な実施形態による、図5に示されるタスク507の詳細を示す流れ図である。 本発明の例示的な実施形態による、図6に示されるタスク602の詳細を示す流れ図である。 本発明の例示的な実施形態による、対話型音声応答システム220の第1の実装形態の主要な要素を示す図である。 本発明の例示的な実施形態による、対話型音声応答システム220の第2の実装形態の主要な要素を示す図である。

Claims (20)

  1. 通信端末から受信され、および対話型音声応答システムにより処理されるコールの最中に前記対話型音声応答システムにおいてビデオ・コンテンツを生成するステップを含む方法であって、前記ビデオ・コンテンツは、前記通信端末にて表示されるものであり、かつ、
    (i)前記対話型音声応答システムの現在の状態のままでいる時間の推定値と、
    (ii)前記通信端末のビデオ表示容量と、に基づくものである方法。
  2. 前記ビデオ・コンテンツは、前記対話型音声応答システムがオーディオ・コンテンツを生成する元のテキスト文字列にも基づく請求項1に記載の方法。
  3. 前記ビデオ・コンテンツを生成するステップは、前記テキスト文字列の簡略版を生成するステップを含む請求項2に記載の方法。
  4. 前記テキスト文字列の前記簡略版を生成するステップは、統語処理を含む請求項3に記載の方法。
  5. 前記テキスト文字列は、VXMLドキュメントの一部であり、前記統語処理は、前記VXMLドキュメントにおけるURIによって指定される文法に基づく請求項4に記載の方法。
  6. 前記テキスト文字列の前記簡略版を生成するステップは、意味処理を含む請求項3に記載の方法。
  7. 前記ビデオ・コンテンツは、前記対話型音声応答システムの前記現在の状態で費やされる時間にも基づく請求項1に記載の方法。
  8. 前記ビデオ・コンテンツは、前記コール中に前記通信システムから前記コールを介して前記対話型音声応答システムに入力されるテキスト又は音響情報にも基づく請求項1に記載の方法。
  9. 通信端末から受信されるコール中にデータ処理システムにおいてビデオ・コンテンツを生成するステップを含む方法であって、前記ビデオ・コンテンツは、前記通信端末において表示されるものであり、かつ、
    前記コール中に前記通信端末を介して入力されたテキスト情報又は音響情報を反映する表現から成り、およびこの表現は前記通信端末のビデオ表示容量に基づいている方法。
  10. 前記表現が、前記テキスト情報又は音響情報の簡略版である請求項9に記載の方法。
  11. 前記テキスト情報又は音響情報の前記簡略版が、統語処理により生成される請求項10に記載の方法。
  12. 前記テキスト情報又は音響情報の前記簡略版が、意味処理により生成される請求項10に記載の方法。
  13. 前記コールが、対話型音声応答システムに関わり、前記表現が、前記対話型音声応答システムの状態にも基づく請求項9に記載の方法。
  14. 前記コールが対話型音声応答システムに関わり、および前記表現が前記対話型音声応答システムの現在の状態のままでいる時間の推定値にも基づいている請求項9に記載の方法。
  15. 通信端末から対話型音声応答システムへのコール中に前記通信端末からの入力を前記対話型音声応答システムで受け取るステップと、
    前記対話型音声応答システムの前の状態、および前記入力に基づいて、前記対話型音声応答システムの新しい状態を前記対話型音声応答システムにて生成するステップと、
    前記新しい状態に関連づけられたテキスト文字列に基づいて、オーディオ・コンテンツを前記対話型音声応答システムにて生成するステップと、
    前記新しい状態のままでいる時間の推定値および前記通信端末のビデオ表示容量に基づいて、前記テキスト文字列の簡略版を前記対話型音声応答システムにて生成するステップと、
    前記通信端末にて表示するためのものであり、かつ前記テキスト文字列の前記簡略版に基づくものである、ビデオ・コンテンツを前記対話型音声応答システムにて生成するステップとを含む方法。
  16. 前記通信端末からの入力の簡略版を生成するステップをさらに含み、前記ビデオ・コンテンツの生成が、当該簡略版にも基づいている請求項15に記載の方法。
  17. 前記入力の前記簡略版の生成は、統語処理を含む請求項16に記載の方法。
  18. 前記テキスト文字列の前記簡略版の生成は、統語処理を含む請求項15に記載の方法。
  19. 前記テキスト文字列は、VXMLドキュメントの一部であり、前記統語処理は、前記VXMLドキュメントにおけるURIによって指定される文法に基づく請求項18に記載の方法。
  20. 前記テキスト文字列の前記簡略版の生成は、意味処理を含む請求項15に記載の方法。
JP2006065467A 2005-03-10 2006-03-10 対話型音声応答システムにおける動的ビデオ生成 Active JP4514723B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US11/076,597 US7778397B2 (en) 2005-03-10 2005-03-10 Dynamic video generation in interactive voice response systems

Publications (2)

Publication Number Publication Date
JP2006254463A JP2006254463A (ja) 2006-09-21
JP4514723B2 true JP4514723B2 (ja) 2010-07-28

Family

ID=36602599

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006065467A Active JP4514723B2 (ja) 2005-03-10 2006-03-10 対話型音声応答システムにおける動的ビデオ生成

Country Status (4)

Country Link
US (1) US7778397B2 (ja)
EP (1) EP1701527B1 (ja)
JP (1) JP4514723B2 (ja)
CA (1) CA2537741C (ja)

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7813485B2 (en) * 2005-05-26 2010-10-12 International Business Machines Corporation System and method for seamlessly integrating an interactive visual menu with an voice menu provided in an interactive voice response system
US20100299590A1 (en) * 2006-03-31 2010-11-25 Interact Incorporated Software Systems Method and system for processing xml-type telecommunications documents
WO2008080421A1 (en) * 2006-12-28 2008-07-10 Telecom Italia S.P.A. Video communication method and system
KR100936757B1 (ko) * 2007-07-13 2010-01-15 (주) 콜게이트 이동통신 단말기의 호 제어 기능을 통한 화면 ars서비스 제공 시스템 및 그 동작 방법
JP5134689B2 (ja) * 2007-10-12 2013-01-30 コール ゲイト カンパニー リミテッド 移動通信端末機の呼制御機能を通しての画面arsサービス提供システム及びその動作方法
US8290125B2 (en) * 2008-09-02 2012-10-16 International Business Machines Corporation Voice response unit shortcutting
US9106745B2 (en) * 2008-09-16 2015-08-11 International Business Machines Corporation Voice response unit harvesting
US8244531B2 (en) * 2008-09-28 2012-08-14 Avaya Inc. Method of retaining a media stream without its private audio content
US9003300B2 (en) * 2008-10-03 2015-04-07 International Business Machines Corporation Voice response unit proxy utilizing dynamic web interaction
CN101626436B (zh) * 2009-06-22 2011-12-28 中兴通讯股份有限公司 一种交互式视频语音应答系统及实现方法
CA2768214A1 (en) * 2009-07-15 2011-01-20 Google Inc. Commands directed at displayed text
EP2486532A4 (en) * 2009-10-05 2013-08-21 Callspace Inc CONTEXT-RELATED TELEPHONE MESSAGE MANAGEMENT
US8903073B2 (en) 2011-07-20 2014-12-02 Zvi Or-Bach Systems and methods for visual presentation and selection of IVR menu
US8572303B2 (en) 2010-02-03 2013-10-29 Tal Lavian Portable universal communication device
US8406388B2 (en) 2011-07-18 2013-03-26 Zvi Or-Bach Systems and methods for visual presentation and selection of IVR menu
US9001819B1 (en) 2010-02-18 2015-04-07 Zvi Or-Bach Systems and methods for visual presentation and selection of IVR menu
US8553859B1 (en) 2010-02-03 2013-10-08 Tal Lavian Device and method for providing enhanced telephony
US8879698B1 (en) 2010-02-03 2014-11-04 Tal Lavian Device and method for providing enhanced telephony
US8625756B1 (en) 2010-02-03 2014-01-07 Tal Lavian Systems and methods for visual presentation and selection of IVR menu
US8681951B1 (en) 2010-02-03 2014-03-25 Tal Lavian Systems and methods for visual presentation and selection of IVR menu
US8594280B1 (en) 2010-02-03 2013-11-26 Zvi Or-Bach Systems and methods for visual presentation and selection of IVR menu
US8548135B1 (en) 2010-02-03 2013-10-01 Tal Lavian Systems and methods for visual presentation and selection of IVR menu
US8548131B1 (en) 2010-02-03 2013-10-01 Tal Lavian Systems and methods for communicating with an interactive voice response system
US8687777B1 (en) 2010-02-03 2014-04-01 Tal Lavian Systems and methods for visual presentation and selection of IVR menu
US8537989B1 (en) 2010-02-03 2013-09-17 Tal Lavian Device and method for providing enhanced telephony
US8666046B2 (en) 2010-04-23 2014-03-04 Logodial Ltd System and method for providing enhanced telephone call functions associated with caller and/or callee information during telephony ringing signal
US9060255B1 (en) 2011-03-01 2015-06-16 Sprint Communications Company L.P. Adaptive information service access
US8867708B1 (en) 2012-03-02 2014-10-21 Tal Lavian Systems and methods for visual presentation and selection of IVR menu
US8731148B1 (en) 2012-03-02 2014-05-20 Tal Lavian Systems and methods for visual presentation and selection of IVR menu
US9137029B1 (en) 2012-03-19 2015-09-15 Google Inc. State and availability monitoring for customer support services for multimedia conferences
US8406155B1 (en) 2012-03-19 2013-03-26 Google Inc. Cloud based contact center platform powered by individual multi-party conference rooms
US9071681B1 (en) 2012-03-19 2015-06-30 Google Inc. Inbound telephony orchestrator for hangout-based contact center platform
WO2013181633A1 (en) * 2012-05-31 2013-12-05 Volio, Inc. Providing a converstional video experience
KR101369982B1 (ko) * 2012-08-01 2014-03-06 김용진 안내 서비스 방법 및 이에 적용되는 장치
US10579330B2 (en) 2015-05-13 2020-03-03 Microsoft Technology Licensing, Llc Automatic visual display of audibly presented options to increase user efficiency and interaction performance
FR3067547A1 (fr) 2017-06-19 2018-12-14 Orange Procede d'etablissement d'une communication avec un serveur interactif
CN108900886A (zh) * 2018-07-18 2018-11-27 深圳市前海手绘科技文化有限公司 一种手绘视频智能配音生成以及同步方法
US12003672B1 (en) * 2022-12-08 2024-06-04 3Hand Llc Methods of duplex transfer of voice streams between mobile subscribers and clients of IM/VOIP with the corresponding implementation of PBX and of the VOIP-cell gateway based on smartphones

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001109762A (ja) * 1999-10-06 2001-04-20 Sony Corp 文書処理方法及び装置並びに記録媒体
JP2002288224A (ja) * 2001-03-28 2002-10-04 Hitachi Software Eng Co Ltd サイトマップ配信方法およびシステム
JP2003288356A (ja) * 2002-03-27 2003-10-10 Docomo Mobile Media Kansai Inc データサーバのアクセス制御方法、そのシステム、管理装置、及びコンピュータプログラム並びに記録媒体
JP2004289803A (ja) * 2003-03-04 2004-10-14 Omron Corp 対話システム、対話制御方法および対話制御プログラム

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5873068A (en) * 1994-06-14 1999-02-16 New North Media Inc. Display based marketing message control system and method
US6091805A (en) * 1995-07-05 2000-07-18 Ncr Corporation Computerized voice response system
US5830068A (en) * 1995-09-08 1998-11-03 Ods Technologies, L.P. Interactive wagering systems and processes
US5802526A (en) * 1995-11-15 1998-09-01 Microsoft Corporation System and method for graphically displaying and navigating through an interactive voice response menu
US20070026852A1 (en) * 1996-10-02 2007-02-01 James Logan Multimedia telephone system
US6246989B1 (en) * 1997-07-24 2001-06-12 Intervoice Limited Partnership System and method for providing an adaptive dialog function choice model for various communication devices
US6157705A (en) * 1997-12-05 2000-12-05 E*Trade Group, Inc. Voice control of a server
US6587822B2 (en) * 1998-10-06 2003-07-01 Lucent Technologies Inc. Web-based platform for interactive voice response (IVR)
SG92628A1 (en) * 1999-02-13 2002-11-19 Newstakes Inc A method and apparatus for converting video to multiple mark-up-language presentations
US6546002B1 (en) * 1999-07-07 2003-04-08 Joseph J. Kim System and method for implementing an intelligent and mobile menu-interface agent
US7065188B1 (en) * 1999-10-19 2006-06-20 International Business Machines Corporation System and method for personalizing dialogue menu for an interactive voice response system
US6320946B1 (en) * 1999-12-23 2001-11-20 Bellsouth Intellectual Property Corporation Information payphone
US7415537B1 (en) * 2000-04-07 2008-08-19 International Business Machines Corporation Conversational portal for providing conversational browsing and multimedia broadcast on demand
US7117152B1 (en) * 2000-06-23 2006-10-03 Cisco Technology, Inc. System and method for speech recognition assisted voice communications
US7089295B2 (en) * 2000-09-06 2006-08-08 Oracle International Corporation Customizing content provided by a service
US6717593B1 (en) * 2000-09-12 2004-04-06 Avaya Technology Corp. Mark-up language implementation of graphical or non-graphical user interfaces
US7386303B2 (en) * 2001-05-18 2008-06-10 Research In Motion Limited Multi-function, multi-state input control device
US7054939B2 (en) * 2001-06-28 2006-05-30 Bellsouth Intellectual Property Corportion Simultaneous visual and telephonic access to interactive information delivery
US7151763B2 (en) * 2001-06-29 2006-12-19 Bellsouth Intellectual Property Corporation Retrieving voice-based content in conjunction with wireless application protocol browsing
US20030120762A1 (en) * 2001-08-28 2003-06-26 Clickmarks, Inc. System, method and computer program product for pattern replay using state recognition
US6912581B2 (en) * 2002-02-27 2005-06-28 Motorola, Inc. System and method for concurrent multimodal communication session persistence
US7406658B2 (en) * 2002-05-13 2008-07-29 International Business Machines Corporation Deriving menu-based voice markup from visual markup
US7324633B2 (en) * 2002-05-30 2008-01-29 At&T Delaware Intellectual Property, Inc. Web integrated interactive voice response
US6876727B2 (en) * 2002-07-24 2005-04-05 Sbc Properties, Lp Voice over IP method for developing interactive voice response system
US7092738B2 (en) * 2002-12-20 2006-08-15 International Business Machines Corporation Navigation of interactive voice response application using a wireless communications device graphical user interface
US7185116B2 (en) * 2002-12-27 2007-02-27 Microsoft Corporation Template-based customization of a user interface for a messaging application program
WO2004066125A2 (en) * 2003-01-14 2004-08-05 V-Enable, Inc. Multi-modal information retrieval system
US7415106B2 (en) * 2004-03-09 2008-08-19 Sbc Knowledge Ventures, Lp Network-based voice activated auto-attendant service with B2B connectors
US7614075B2 (en) * 2004-08-13 2009-11-03 Microsoft Corporation Dynamically generating video streams for user interfaces
US7813485B2 (en) * 2005-05-26 2010-10-12 International Business Machines Corporation System and method for seamlessly integrating an interactive visual menu with an voice menu provided in an interactive voice response system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001109762A (ja) * 1999-10-06 2001-04-20 Sony Corp 文書処理方法及び装置並びに記録媒体
JP2002288224A (ja) * 2001-03-28 2002-10-04 Hitachi Software Eng Co Ltd サイトマップ配信方法およびシステム
JP2003288356A (ja) * 2002-03-27 2003-10-10 Docomo Mobile Media Kansai Inc データサーバのアクセス制御方法、そのシステム、管理装置、及びコンピュータプログラム並びに記録媒体
JP2004289803A (ja) * 2003-03-04 2004-10-14 Omron Corp 対話システム、対話制御方法および対話制御プログラム

Also Published As

Publication number Publication date
US20060203977A1 (en) 2006-09-14
EP1701527A1 (en) 2006-09-13
CA2537741C (en) 2011-12-13
US7778397B2 (en) 2010-08-17
EP1701527B1 (en) 2018-10-03
CA2537741A1 (en) 2006-09-10
JP2006254463A (ja) 2006-09-21

Similar Documents

Publication Publication Date Title
JP4514723B2 (ja) 対話型音声応答システムにおける動的ビデオ生成
US7184523B2 (en) Voice message based applets
US6832196B2 (en) Speech driven data selection in a voice-enabled program
US8160215B2 (en) Systems and methods for visual presentation and selection of IVR menu
US7167830B2 (en) Multimodal information services
US8442563B2 (en) Automated text-based messaging interaction using natural language understanding technologies
US8223931B1 (en) Systems and methods for visual presentation and selection of IVR menu
US8615396B2 (en) Voice response unit mapping
US7450698B2 (en) System and method of utilizing a hybrid semantic model for speech recognition
US7680816B2 (en) Method, system, and computer program product providing for multimodal content management
US7260530B2 (en) Enhanced go-back feature system and method for use in a voice portal
US20140314227A1 (en) System and method for speech-enabled call routing
US8553859B1 (en) Device and method for providing enhanced telephony
US8358753B2 (en) Interactive voice response (IVR) cloud user interface
US8880120B1 (en) Device and method for providing enhanced telephony
AU2004201992A1 (en) Semantic object synchronous understanding implemented with speech application language tags
AU2004201993A1 (en) Semantic object synchronous understanding for highly interactive interface
US8625756B1 (en) Systems and methods for visual presentation and selection of IVR menu
US9088655B2 (en) Automated response system
US6813342B1 (en) Implicit area code determination during voice activated dialing
US20030055651A1 (en) System, method and computer program product for extended element types to enhance operational characteristics in a voice portal
US8731148B1 (en) Systems and methods for visual presentation and selection of IVR menu
US8867708B1 (en) Systems and methods for visual presentation and selection of IVR menu
US20090163188A1 (en) Method and system of providing an audio phone card
US20060212408A1 (en) Framework and language for development of multimodal applications

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071105

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071107

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080207

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080507

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090209

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090508

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090513

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090807

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100412

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100511

R150 Certificate of patent or registration of utility model

Ref document number: 4514723

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130521

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130521

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250