JP2005518765A - 音声対話システムを動作させる方法 - Google Patents

音声対話システムを動作させる方法 Download PDF

Info

Publication number
JP2005518765A
JP2005518765A JP2003572279A JP2003572279A JP2005518765A JP 2005518765 A JP2005518765 A JP 2005518765A JP 2003572279 A JP2003572279 A JP 2003572279A JP 2003572279 A JP2003572279 A JP 2003572279A JP 2005518765 A JP2005518765 A JP 2005518765A
Authority
JP
Japan
Prior art keywords
user
data
transmission mode
voice
dialogue system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003572279A
Other languages
English (en)
Inventor
ゴークハン ディンセル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of JP2005518765A publication Critical patent/JP2005518765A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4931Directory assistance systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)

Abstract

音声認識装置及び音声出力装置を用いてユーザと通信する音声対話システムであって、ユーザに対して当該音声対話システムにより対話に基づいて当該ユーザ用に検出及び/又は発生されたデータを送信するような音声対話システムを動作させる方法が記載されている。本発明によれば、ユーザの伝送モード選択コマンドを受信した後、音声対話システムは、ユーザに送信されるべきデータを上記の選択された伝送モードに適したデータフォーマットでフォーマッティングし、該データを当該伝送モードに適したインターフェースを介して送信する。好適な音声対話システムも記載されている。

Description

本発明は、音声認識装置及び音声出力装置を用いてユーザと通信する音声対話システムを動作させる方法であって、該音声対話システムがユーザに対して該ユーザに関し対話に基づいて検出及び/又は発生されたデータを送信するような方法に関する。
本発明は、更に、上記方法を実行するための対応する自動音声対話システム及びプログラムコード手段を備えるコンピュータプログラムにも関する。
音声認識装置及び音声出力装置を使用してユーザと通信する音声対話システムは、かなり前から既に知られている。斯かるシステムは、しばしば、ボイスポータル又は音声アプリケーションとしても知られている音声駆動自動システムである。このような音声対話システムは、例えば空港等における静止情報システムのような、ユーザが音声対話システムと通信することができるように位置しなければならない特別な端末を有することができる。しかしながら、音声対話システムは、しばしば、斯かる音声対話システムを例えば通常の電話、携帯電話又は電話機能を持つPC等を用いて使用することができるように、公衆通信ネットワーク等に対する接続を有するようなシステムである。このような音声対話システムの例は、発呼者に対して可能な限り即座且つ便利に所望の情報を提供し又は発呼者を該発呼者の特定の要求に対して回答する立場にあるオフィスに接続するために、今や例えば幾つかの大会社、機関及びオフィスにより使用されている自動化発呼応答及び情報システムである。他の例は、幾つかの電話会社により既に使用されている自動化電話帳問合せ、自動化時刻表若しくはフライトスケジュール情報サービス、又は特定の地域に対する例えば映画館及び劇場番組等の一般的なイベントの詳細を提供する情報サービスである。単に、ユーザに対して情報を提供し又は見付け、且つ、該情報をユーザに対して要求されたように送信することに加えて、幾つかの音声対話システムは、例えば列車若しくは飛行機の座席又はホテルの部屋の予約サービス、支払いサービス又は物品発注サービスのような付加的なサービスも提供する。同様に、勿論、例えばユーザが先ず何のサービスを利用したいかを決定しなければならず、次いで所望のサービスに転送される複雑な音声対話システムのような、広範囲の情報及びサービスシステムの組合せも可能である。従って、例えばインターネット上におけるように、原理的には、音声対話システムを介して如何なる所望のサービスもユーザに提供することが可能である。しかしながら、音声対話システムはサービスを使用するためにユーザが通常の電話又は携帯電話しか必要としないという利点を有している。しかしながら、一方では、斯様な音声対話システムは、ユーザに対して該ユーザとの対話に基づいて検出又は発生されたデータ、即ち対話結果又は中間結果(例えば情報システムの場合は所望の情報、又は予約システムの場合は予約確認)が、音声出力装置により対話中にユーザに対して音響的に出力されるのみであるという欠点を有している。この場合、ユーザは情報出力(例えば情報リクエストの場合は検索された電話番号)を記憶するか又は可能な限り即座に書き留めるかの何れかを行って、この情報を後に使用することができるようにしなければならない。例えば予約サービス又は電子百貨店の場合のような、法的に拘束し得る商業取引を含むサービスの場合、ユーザは、例えば問題が生じた場合に証拠として使用することができるような如何なる書面(書かれた)確認も有することがない。
本発明の目的は、これらの欠点が回避されるような対話システムを動作させる改善された方法及び対応する対話システムを提供することにある。
この目的は、上述した型式の方法であって、ユーザの伝送モード選択コマンドを受信した後、前記音声対話システムが前記ユーザに対して送信されるべきデータを、選択された伝送モードに適したデータフォーマットでフォーマッティングすると共に、該データを当該伝送に適したインターフェースを介して送信することを特徴とする。
このように、ユーザは、伝送モード選択コマンドを入力することにより、音声出力以外の如何なる他の所望の伝送モードによっても(例えば、ファクシミリにより、eメイルとして、SMSにより又は他のショートメッセージサービスを介して)データを送信させる選択枝を有するようになる。他の伝送モードによる送信は、音声出力に加えて又は音声出力の代替として選択することができる。このように、ユーザは、自身に関連するデータを、自身が情報を最早書き留めないことを可能にするか又は自身に書かれた証拠を提供するような形で受信するという選択枝を有するようになる。かくして、本発明による電話番号問合せサービスの場合、ユーザは例えば見付かった電話番号を有利にも自身の携帯電話にSMSにより直接送信させ、この電話番号をオプションとして該携帯電話の電子電話帳に直接入力することができるようにし、及び/又は即座に該番号にダイヤルすることができる。
従って、本発明による自動音声対話システムは、ユーザと通信するための音声認識装置及び音声出力装置、並びに該ユーザとの対話の関数として該ユーザ用の特定のデータを検出及び/又は発生すると共に該データをユーザに送信する手段に加えて、上記データを、音声出力に加えた又は音声出力の代替としての他の伝送モードに適したデータフォーマットでフォーマッティングする少なくとも1つのフォーマッティング手段を有さねばならない。更に、該音声対話システムは、前記音声認識装置を介してユーザの伝送モード選択コマンドを受信して、伝送モードを選択すると共に、当該音声対話システムを、前記データが前記伝送モード選択コマンドの関数として適切なフォーマッティング装置により前記選択された伝送モードに従ってフォーマッティングされ、且つ、適切なインターフェースを介して送信されるように制御する制御手段を必要とする。
従属請求項は、各々、本発明の特別に有利な実施例及び更なる発展を含んでいる。
ユーザに対する上記データの送信のためのインターフェースとして、当該音声対話システムは、一方においては例えば電話接続及び別のインターネット接続等の個々の伝送モードに対する別個のインターフェースを有することができる。他方においては、多機能インターフェースを使用することもでき、該インターフェースは制御装置により適切に起動されて、データが当該伝送モードに対する正しいチャンネル上で正しいプロトコルを使用して送信されることを保証する。関連するネットワーク又は受信装置によりサポートされる、当該伝送モードに適した如何なる所望の規格化されたプロトコルも使用することができる。これらの例は、インターネット上のデータ転送に対するH.323若しくはT1規格、又は電気通信規格SS7若しくはC7である。
上記伝送モード選択コマンドは、対話内で、即ちユーザによる音声入力により送信される。この目的のため、当該対話システムはユーザに対して適切な入力要求(即ち、所謂“プロンプト”)を事前に出力することができ、該プロンプトにより、ユーザは例えば何のモードで特定のデータが送信されるべきかを尋ねられる。見付けられた電話番号の出力の場合における斯様なプロンプトの一例は、“番号を言いましょうか、又はeメイル、SMS又はファクシミリで送信してほしいですか?”である。
しかしながら、ユーザにとっては、当該音声対話システムにより理解されるであろう自身の意志の、即ち要求されない伝送モード選択コマンドを与えることも可能である。適切に強力な音声認識装置の場合、この伝送モード選択コマンドは、連続する文章又は文章のシーケンスから、オプションとして全ての以前の対話により提供される文脈の補助で検出することもできる。この場合、ユーザは、例えば“予約をしたいし、ファクシミリによる確認を受信したい”のような命令を与えることができる。この場合、音声認識装置及び/又はデータ伝送制御装置は、連続するテキスト内の特定のキーワード(上記例の場合は、“ファクシミリによる確認”)を認識及び処理するように適切に設計されねばならない。
一実施例においては、伝送モード選択コマンドが複数の伝送モードを指示し得るような追加のオプションが設けられる。この場合、ユーザは例えば所望の情報が、対話を行うために該ユーザにより使用される携帯電話へSMSにより、及び更に印刷されるように該ユーザのファクシミリマシンへの両方に送信されるように選択することができる。この場合、当該音声対話システムはデータを指示された伝送モードの各々により並列に又は順次に送信する。
もし、1つの選択された伝送モードにおいて、データの送信が異なるデータフォーマットで可能であるならば、該データは好ましくはユーザにより指示されるデータフォーマットに従ってフォーマッティングされ、送信される。1つの伝送モードにおいて種々のデータフォーマットでデータを送信するというオプションは、なかでも、eメイル添付としての送信の場合に利用可能である。この場合、データは例えばワードプロセッサファイルとして、スプレッドシートファイルとして又は特定のデータベースからのファイルとして送信することができる。ユーザが自身でデータフォーマットを選択しない場合、当該音声対話システムはデータフォーマット選択コマンドを入力するようにユーザに対してプロンプトを出力する。
伝送モードに加えて、当該音声対話システムは選択された伝送モードにより当該データが送信されるべきアドレス、即ち、例えば対応する受信端末に到達することができる当該接続の加入者番号も知らなければならない。
この情報は、ユーザがアドレスコマンドを当該音声対話システムに明示的に送信することにより、該音声対話システムにより受信することができる。このアドレスコマンドは、例えばファクシミリ番号又はeメイルアドレスを含むエントリのように完全なアドレスとするか、又は当該音声対話システムが追加のアドレス情報を使用して完全なアドレスを決定するようなエントリからなるものの何れかとすることができる。このような“完全でない”アドレスコマンドの一例は、“私の携帯電話に送信せよ”のような命令である。必要な追加のアドレス情報(この例では、ユーザの携帯電話の加入者番号)は、当該音声対話システムにより、なかでも、従来の発呼者識別方法を使用して決定することができる。一例は、CLI(発呼回線識別)方法である。
他の好ましい実施例においては、種々のユーザのユーザプロファイルが、当該音声対話システムがアクセスするメモリに記憶される。このようなユーザプロファイルは、各ユーザの必要なアドレス情報を、ユーザは装置又は伝送モードのみを指示すればよいように、含んでいる。或るユーザに関する複数のファクシミリ若しくは電話番号又はeメイルアドレスも該ユーザプロファイルに記憶することができ、例えば特定のキーワードと組み合わされる。この場合、ユーザは自身のアドレスコマンド内で関連するキーワードのみ(例えば“オフィスのファクシミリ”又は“自宅のファクシミリ”)を指示すればよい。このようなサービスは、ユーザが当該音声対話システムの以前の使用を介して又は明示的な初期化手順を介して該音声対話システムにより知られており、例えば発呼者番号の送信により当該対話の開始時に識別されるような場合に、特に達成するのが簡単である。
当該音声対話システムにとり前後状況から1つのアドレスしか可能性がないことが明らかな場合は、特定のアドレスコマンドの要求は必要ではない。例えば、唯1つのファクシミリマシン及び1つのeメイルアドレスしかユーザプロファイルに入力されていないユーザの場合、“ファクシミリ”又は“eメイル”なる伝送モードの選択は、何のアドレスにデータが送信されるべきかを示すことになる。
同様に、ユーザが当該音声対話システムを携帯電話から呼び出し、且つ、該携帯電話の加入者番号が確かめられている場合、該音声対話システムは、伝送モード“SMS”(又は他の携帯電話ショートメッセージサービス)が選択されると、当該携帯電話に対してメッセージを即座に送信することができる。この手順は、前記音声出力装置に加えて、1つのみのSMS又は対応するショートメッセージサービス用の追加のフォーマッティング装置が存在し、且つ、ユーザが音響出力に加えて又は代わりに対話の間に自身により使用される端末に対して当該データをショートメッセージとして送信させるのみの選択を有するような、本発明による音声対話システムの比較的簡単な例の場合に特に適している。比較的低価格で達成可能な本発明による斯様な音声対話システムは、費用の掛かる書面確認は不要であるが、要求した電話番号を対応する端末において保存可能な形で直接受信することがユーザにとり助かるような自動化電話番号問合せの例に適している。
当該音声対話システムは、かなりの程度に、適切なインターフェースを介して公衆通信ネットワークに接続されたサーバ上の適切なソフトウェアの形で安価に設けることができる。この場合、前記音声認識装置及びフォーマッティング装置の両者並びに制御装置は、好ましくは、適切なソフトウェアモジュールとする。前記音声出力装置も、同様に、例えばテキスト/音声システム(TTSシステム)等のソフトウェアモジュールの形をとることができる。しかしながら、該音声出力装置は更に“プロンプトプレーヤ”を有することができ、該プレーヤはユーザに対して特定の質問又は常に繰り返すアナウンスを規格化されたサウンドファイルとして再生する。
この場合、上記種々のソフトウェアモジュールは、1つの独立のコンピュータ上の代わりに、種々のネットワーク化されたコンピュータ上にインストールすることができる。このように、例えば公衆通信ネットワークとの接続のためのインターフェースを有するコンピュータは、上記制御装置(特に、対話制御モジュール)、音声出力装置並びに必要なデータベース及びフォーマッティング装置を有することができる。もし必要なら、相対的に計算的に強力な自動音声認識を、第2の特別に能力のあるコンピュータ上にインストールされた音声認識モジュールにより実行することもできる。
以下、本発明を図面に示す実施例を参照して更に説明するが、本発明は斯かる実施例に限定されるものではない。
図1は、本発明による音声対話システム1における本発明に必須な構成要件のみを示す比較的大まかな概略図である。音声対話システム1は多機能インターフェース4を有し、該インターフェースは公衆通信網との接続を形成すると共に、当該音声対話システム1がユーザにより通常の移動体無線ネットワーク又は地上ネットワークを介して電話又は携帯電話15により接触されるのを可能にする。更に、この多機能インターフェース4は、更なる出力チャンネルを介してユーザの携帯電話15にSMSを送信し、及びユーザのファクシミリ16にファックスを送り又はユーザのメイルボックス17にeメイルを送る能力も含んでいる。
ユーザにより携帯電話15を介し、更にインターフェース4を介して当該音声対話システム1に送信された入力音声データSDIは、先ず、音声認識装置3に送られ、該音声認識装置は音声データSDIを認識の目的で処理する。
当該音声対話システムに関して音声認識装置3により認識された、ユーザコマンド、検索要求等の情報は、中央制御ユニット5の対話制御モジュール6に送られる。この対話制御モジュール6は、ユーザとの実際の対話の進行を制御する。
制御は、当該システム(この場合はメモリ7)に所謂“対話記述言語”で記憶された対話記述により実行される。これは、如何なる所望の対話記述言語でもよい。通常の言語は、例えば、“C”又は“C++”又は所謂“ハイブリッド言語”のような処理指向プログラミング言語であり、これら言語は例えば“ボイスXML”又は“PSPHDLL”のように宣言的及び処理指向的である。これらは、インターネットページを記述するために一般に使用されているHTML言語に構造が類似した言語である。しかしながら、例えば分岐点又は特定のデータベースの呼び出し等の、当該対話手順内の個々の位置がグラフィックブロック及び斯かるブロック間のラインによる接続の形態で表されるような例えば純粋にグラフィック的な対話記述言語も使用することができる。
上記対話制御モジュールは、対話を継続するために、例えばインプット要求(所謂“プロンプト”)等の特定の情報が適切な時点でユーザに出力されることを保証する。このプロンプト出力は、例えばTTSモジュール等の音声出力ユニット2を介して実行されるが、該ユニットはマシン読み取り可能なデータ又はテキストを音声データに変換する。次いで、該出力音声データSDOは、ユーザの携帯電話15に送信するためにインターフェース4に転送される。状態及びアクセス制御のために、音声認識装置3、音声発生装置(音声出力ユニット)2及びインターフェース4は、更に、適切な制御ライン12、13、14又はバスを介して中央制御ユニット5に接続されている。
音声対話システム1の機能に依存して、中央制御ユニット5は、対話の間においてユーザにより所望される情報を検出するために1以上のデータベースにアクセスすることができる。これらは、当該音声対話システム1自体内のデータベースであり得るか、又は特定のサービスプロバイダ等に属する外部データベースとすることもでき、音声対話システム1は斯かる外部データベースにインターネット又は他のネットワークを介してアクセスすることができる。簡略化の目的で、図1は内部データベース8の記号的表示のみを含んでいる。
例えば予約手順の書面(書かれた)確認等の、当該ユーザのためにデータベース8から検出された又は対話の間に発生されたデータは、音声出力装置2を介してのみならず、例えばファクシミリにより、eメイルとして又はSMSとしてのように種々の他の伝送モードによっても送信することができる。この目的のため、音声対話システム1は本発明によれば複数のフォーマッティング装置(即ち、変換装置)9、10、11を有し、これら装置は中央制御ユニット5から到来し、送信を必要とするデータを、対応する伝送モードにとり必要なデータフォーマットに変換する。
詳細には、図1に示された音声対話システム1は、データDをショートメッセージフォーマットKDに(例えば、SMSフォーマットに)変換する第1フォーマッティング装置9を有している。音声対話システム1は、更に、データDをファックスデータフォーマットFDに変換するファックスフォーマッティング装置10を有している。最後に、音声対話システム1はeメイルフォーマッティング装置11を有し、該装置はデータDをeメイルフォーマットMDに、又は標準のeメイルに添付することができるファイルフォーマットに変換する。この標準のeメイルへの添付は、好ましくは、eメイルフォーマッティング装置11内で実行される。各フォーマッティング装置9、10、11から到来するデータKD、FD、MDは、次いで、多機能インターフェース4に渡され、そこから、適切な出力チャンネルを介して所望の伝送モードでファクシミリマシン16、ユーザのメイルボックス17又はユーザの携帯電話15に送信される。
ここで、図1に図示された構成は1つの可能性のある例に過ぎないことを明示的に述べておく。本発明による音声対話システムは、物理的に、種々の他のハードウェア及び/又はソフトウェアアーキテクチャの形態をとることもできる。このように、例えば上記種々のフォーマッティング装置は上記インターフェース内に直接組み込むこともでき、又は当該音声対話システムは各伝送モードに対して別個のインターフェースを有することもでき、斯かるインターフェースは対応するフォーマッティング装置の下流に接続される。同様に、当該音声対話システムは、例えば“プロンプトプレーヤ”等の、ここでは説明しない追加の構成要素を有することもできる。更に、当該音声対話システムは、上記に明示したもの以外の他の伝送モード用の他のフォーマッティング装置を有することもできる。
図2は、本音声対話システムを使用する場合の可能性のある対話シーケンスのフローチャートである。
対話は初期化で開始し、該初期化において、ユーザは当該音声対話装置により挨拶されると共に、オプションとして自身の名前及び多分パスワードを供給することにより自身を識別しなければならない。このような段階においては、例えばCLIを用いた発呼者の識別を実行することもできる。
次に、ユーザは所望のサービスを選択するオプションを持つ。当該音声対話システムが1つの型式のみのサービスを提供するものである場合は、このステップは省略することができる。本実施例においては、ユーザがホテルの部屋を予約したいと仮定する。
この目的のため、ユーザは例えばホテルの名称若しくは住所、部屋のタイプ及び所望する日等の必要なデータを先ず入力する。次いで、当該音声対話システムは、当該ホテルにより既に受け付けられた予約の数に関する最新データを得るためにデータベースの問合せを実行する。ここで、予約が可能かが分かる。可能でない場合、ユーザは代わりを欲するかを尋問される。ユーザが肯定した場合、当該音声対話システムは推奨を行い、ユーザは該推奨を単に確認するだけでよい。そうすると、データベースの問合せが実行され、予約が可能かが明確になる。ユーザが、代替の推奨を受けたくない場合、ユーザは次のステップで他のサービスを欲するか尋問される。もしそうなら、当該対話は前記サービス選択点から再び開始し、それ以外の場合、当該対話は終了する。
予約が可能であることが分かったら、更なるステップにおいて予約がデータベースで実行され、続くステップにおいて予約IDが発行され、該予約IDは何の番号で当該予約がなされたかを示す。次いで、ユーザは追加の確認がほしいかを尋問される。ユーザが否定した場合、当該対話システムはユーザが他のサービスを必要とするかを尋問する。もしそうなら、当該シーケンスは再びサービス選択で開始し、それ以外の場合、該対話は終了する。
しかしながら、ユーザが上記追加の確認を欲した場合、次の時点で、当該対話システムが上記追加の確認に関する尋問に対する応答に伝送モード選択コマンドが既に含まれていたか(例えば、ユーザが既に“ハイ、ファクシミリにより”と回答していたか)を先ずチェックすることにより、そうでない場合は、適切なプロンプトをユーザに出力し、これによりユーザが伝送モード選択コマンドをインプットするように要求されることにより、伝送モードが選択される。
次いで、上記確認がどちらに送られるべきかのアドレスが特定される。例えば、伝送モード“ファクシミリ”が選択された場合、ユーザはファクシミリ番号を尋ねられる。
次のステップにおいて、書かれた確認が、当該ユーザにより指示されたファクシミリに送信される。この書かれた確認が送信された後、ユーザは当該対話システムにより他のサービスを必要とするかを尋ねられる。ユーザが肯定すると、当該対話システムはサービス選択から再び開始する。それ以外の場合、当該対話は終了する。
上述したシーケンスは、本発明の本質的概念に影響を与えることなく種々変更可能であることは明らかである。このように、例えば、対話内における如何なる所望の時点においても確認のための音声出力を付加的に提供することも容易に可能である。特に、伝送モードの選択の後、及びデータが送られるべき装置のアドレス又は加入者番号の入力の後に、“所望の情報は、あなたのファクシミリ端末番号’123456789’に送られています”のような情報を供給することもできる。
本発明は、音声対話システムの大幅に便利な利用を可能にするような簡単な方法を提供する。何故なら、ユーザは音声対話システムから得られた情報を、最早、記憶し又は書き留める必要がないからである。更に、本発明は音声対話システムの更なる可能性のある応用を、例えば法的な理由で書かれた確認等が賢明であるか又は確かに必要となるような分野において切り開くものである。
図1は、本発明による音声対話システムの概略ブロック図である。 図2は、音声対話システムを使用して後の確認を伴うサービスを予約するための可能性のある対話シーケンスのフローチャートである。

Claims (10)

  1. 音声認識装置及び音声出力装置を用いてユーザと通信する音声対話システムを動作させる方法であって、該音声対話システムが前記ユーザに対して対話に基づいて該ユーザのために検出及び/又は発生されたデータを送信するような方法において、
    ユーザの伝送モード選択コマンドを受信した後、前記音声対話システムは前記ユーザに対して送信されるべきデータを、選択された伝送モードに適したデータフォーマットでフォーマッティングすると共に、該データを当該伝送モードに適したインターフェースを介して送信することを特徴とする方法。
  2. 請求項1に記載の方法において、前記伝送モード選択コマンドは複数の伝送モードを指示し、前記音声対話システムが前記データを前記指示された伝送モードの各々で送信することを特徴とする方法。
  3. 請求項1又は請求項2に記載の方法において、1つの選択された伝送モードにおいて、前記データの送信は異なるデータフォーマットで可能であり、前記音声対話システムは前記ユーザから受信されたデータフォーマット選択コマンドに従って前記データをフォーマッティングし且つ該データを送信することを特徴とする方法。
  4. 請求項1ないし3の何れか一項に記載の方法において、前記ユーザは前記音声対話システムに対して、何のアドレスに前記データが前記伝送モードに従って送信されるべきであるかのアドレスコマンドを送信することを特徴とする方法。
  5. 請求項4に記載の方法において、前記音声対話システムは、前記データが前記伝送モードに従って送信されるべきアドレスを、前記選択された伝送モード及び/又は前記アドレスコマンドに基づいて付加的に検出されるアドレス情報を用いて決定することを特徴とする方法。
  6. 請求項1ないし5の何れか一項に記載の方法において、特定の伝送モード及び/又は追加のアドレス情報が選択された場合に前記データが送信されるべきアドレスが、前記音声対話システムにおける各ユーザに割り当てられたユーザプロファイルに記憶されることを特徴とする方法。
  7. ユーザと通信するために音声認識装置及び音声出力装置を有すると共に、
    前記ユーザとの対話の関数として該ユーザのための特定のデータを検出及び/又は発生し、該データを前記ユーザに送信する手段を有する、
    自動音声対話システムにおいて、
    前記音声出力に加えて又は該音声出力の代替として前記データを他の伝送モードに適したデータフォーマットでフォーマッティングする少なくとも1つの追加フォーマッティング装置と、
    前記音声認識装置を介してユーザの伝送モード選択コマンドを受信して、特定の伝送モードを選択すると共に、前記音声対話システムを、前記データが前記伝送モード選択コマンドの関数として適切なフォーマッティング装置により前記選択された伝送モードに従ってフォーマッティングされ、且つ、適切なインターフェースを介して送信されるように制御する制御手段と、
    を有することを特徴とする音声対話システム。
  8. 請求項7に記載の音声対話システムにおいて、特定の伝送モード及び/又は該伝送モードに必要なアドレス情報が選択された場合に前記データが送信されるべきアドレスを種々のユーザに対して記憶するメモリ手段を有することを特徴とする音声対話システム。
  9. プログラムコード手段を有するコンピュータプログラムであって、該プログラムが音声対話システムコンピュータ上で実行された場合に請求項1ないし6の何れか一項に記載の方法の全ステップを実行するコンピュータプログラム。
  10. 請求項9に記載のプログラムコード手段を有するコンピュータプログラムにおいて、コンピュータ読み取り可能なデータ記憶媒体上に記憶されたコンピュータプログラム。
JP2003572279A 2002-02-26 2003-02-21 音声対話システムを動作させる方法 Pending JP2005518765A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE10208295A DE10208295A1 (de) 2002-02-26 2002-02-26 Verfahren zum Betrieb eines Sprach-Dialogsystems
PCT/IB2003/000643 WO2003073734A1 (en) 2002-02-26 2003-02-21 Method of operating a speech dialog system

Publications (1)

Publication Number Publication Date
JP2005518765A true JP2005518765A (ja) 2005-06-23

Family

ID=27675003

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003572279A Pending JP2005518765A (ja) 2002-02-26 2003-02-21 音声対話システムを動作させる方法

Country Status (6)

Country Link
US (1) US20050114139A1 (ja)
EP (1) EP1481536A1 (ja)
JP (1) JP2005518765A (ja)
AU (1) AU2003206036A1 (ja)
DE (1) DE10208295A1 (ja)
WO (1) WO2003073734A1 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1704882A (zh) * 2004-05-26 2005-12-07 微软公司 使用键盘的亚洲语言输入
US8977636B2 (en) 2005-08-19 2015-03-10 International Business Machines Corporation Synthesizing aggregate data of disparate data types into data of a uniform data type
US20070043572A1 (en) * 2005-08-19 2007-02-22 Bodin William K Identifying an action in dependence upon synthesized data
US7958131B2 (en) * 2005-08-19 2011-06-07 International Business Machines Corporation Method for data management and data rendering for disparate data types
US20070061371A1 (en) * 2005-09-14 2007-03-15 Bodin William K Data customization for data of disparate data types
US8266220B2 (en) 2005-09-14 2012-09-11 International Business Machines Corporation Email management and rendering
US20070061712A1 (en) * 2005-09-14 2007-03-15 Bodin William K Management and rendering of calendar data
US8694319B2 (en) * 2005-11-03 2014-04-08 International Business Machines Corporation Dynamic prosody adjustment for voice-rendering synthesized data
US8271107B2 (en) 2006-01-13 2012-09-18 International Business Machines Corporation Controlling audio operation for data management and data rendering
US20070165538A1 (en) * 2006-01-13 2007-07-19 Bodin William K Schedule-based connectivity management
US9135339B2 (en) * 2006-02-13 2015-09-15 International Business Machines Corporation Invoking an audio hyperlink
US20070192675A1 (en) * 2006-02-13 2007-08-16 Bodin William K Invoking an audio hyperlink embedded in a markup document
US20070192673A1 (en) * 2006-02-13 2007-08-16 Bodin William K Annotating an audio file with an audio hyperlink
US9196241B2 (en) 2006-09-29 2015-11-24 International Business Machines Corporation Asynchronous communications using messages recorded on handheld devices
US9318100B2 (en) 2007-01-03 2016-04-19 International Business Machines Corporation Supplementing audio recorded in a media file
US8646702B2 (en) 2011-10-13 2014-02-11 Deere & Company Boom fold structure
US11082563B2 (en) * 2015-12-06 2021-08-03 Larry Drake Hansen Process allowing remote retrieval of contact information of others via telephone voicemail service product

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6625642B1 (en) * 1998-11-06 2003-09-23 J2 Global Communications System and process for transmitting electronic mail using a conventional facsimile device
US7110952B2 (en) * 1999-12-07 2006-09-19 Kursh Steven R Computer accounting method using natural language speech recognition

Also Published As

Publication number Publication date
US20050114139A1 (en) 2005-05-26
EP1481536A1 (en) 2004-12-01
WO2003073734A1 (en) 2003-09-04
AU2003206036A1 (en) 2003-09-09
DE10208295A1 (de) 2003-09-04

Similar Documents

Publication Publication Date Title
US6788770B1 (en) Intelligent voice response system with navigator database
JP2005518765A (ja) 音声対話システムを動作させる方法
US7254384B2 (en) Multi-modal messaging
US7522711B1 (en) Delivery of audio driving directions via a telephone interface
US7233655B2 (en) Multi-modal callback
US7640006B2 (en) Directory assistance with multi-modal messaging
US6859776B1 (en) Method and apparatus for optimizing a spoken dialog between a person and a machine
EP0935378B1 (en) System and methods for automatic call and data transfer processing
US6948129B1 (en) Multi-modal, multi-path user interface for simultaneous access to internet data over multiple media
US20090298529A1 (en) Audio HTML (aHTML): Audio Access to Web/Data
US20040267585A1 (en) Methods and systems for assisting scheduling with automation
US20050033582A1 (en) Spoken language interface
US20050288927A1 (en) Quality of service call routing system using counselor and speech recognition engine and method thereof
JP2009520224A (ja) 音声アプリケーションを処理する方法、サーバー、クライアント装置、コンピュータ読み取り可能な記録媒体(マークアップを介する音声アプリケーションの処理の共有)
GB2390191A (en) Voice controlled business scheduling system and method
TW200540649A (en) Method and apparatus for automatic telephone menu navigation
US20020169615A1 (en) Computerized voice-controlled system for compiling quality control data
WO2002028074A2 (en) Variable automated response system
EP2378436B1 (en) Virtual customer database
JP6689953B2 (ja) 通訳サービスシステム、通訳サービス方法及び通訳サービスプログラム
US20050089150A1 (en) Voice enabled interactive drug and medical information system
JP2005011089A (ja) 対話装置
US20020156635A1 (en) Automatic information system
JP2002215670A (ja) 音声応答装置、音声応答方法、音声応答プログラム、音声応答プログラムを記録した記録媒体および予約システム
JP4490887B2 (ja) 多数の情報システムに一律な操作でアクセスするための方法および機器

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060220

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070601

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070612

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080122