JP2004356896A - 自動応答装置およびそれを用いた自動応答システム、テレフォンバンキングシステム - Google Patents

自動応答装置およびそれを用いた自動応答システム、テレフォンバンキングシステム Download PDF

Info

Publication number
JP2004356896A
JP2004356896A JP2003151460A JP2003151460A JP2004356896A JP 2004356896 A JP2004356896 A JP 2004356896A JP 2003151460 A JP2003151460 A JP 2003151460A JP 2003151460 A JP2003151460 A JP 2003151460A JP 2004356896 A JP2004356896 A JP 2004356896A
Authority
JP
Japan
Prior art keywords
video
unit
videophone
voice
scenario
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003151460A
Other languages
English (en)
Other versions
JP2004356896A5 (ja
Inventor
Eiji Fujikawa
英士 藤川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Neu & Computing Inc
Original Assignee
Neu & Computing Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Neu & Computing Inc filed Critical Neu & Computing Inc
Priority to JP2003151460A priority Critical patent/JP2004356896A/ja
Publication of JP2004356896A publication Critical patent/JP2004356896A/ja
Publication of JP2004356896A5 publication Critical patent/JP2004356896A5/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】音声のみによる自動応答システムは、ガイダンスを最後まで聞かないと操作ができないため、処理時間がかかる。選択肢が多数の場合は、最初の選択肢を忘れるなどするため、質問回数を増やして選択肢を低減するなどしているが、これにより更に処理の時間がかかる。処理時間の増加はユーザの負担となり、誤動作も多くなる。
【解決手段】テレビ電話端末を用いて音声や画像などを併用することでガイダンスなどにおける話者の理解度を高める。ガイダンスを最後まで聞かなくても一覧して次の操作が行える上、選択肢を多くすることができ、1回の処理が完了する時間を短縮でき通信コストを下げることができる。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、自動応答装置、自動応答システムおよびテレフォンバンキングシステムにかかり、特に、テレビ電話に接続して自動応答を行う自動応答装置、自動応答システムおよびテレフォンバンキングシステムに関する。
【0002】
【従来の技術】
電話を使った自動応答システム(IVR:Interactive Voice Responseの略)は様々な業界や業務で導入されている。従来の自動応答システムは音声ガイダンスを発し、端末からのプッシュボタンによって操作を行うシステムであり、シナリオと呼ばれる一種のプログラムによって動作し、プッシュ信号を音声認識することによってユーザからの指示内容を受け付ける。このようなしくみは銀行のテレフォンバンキングやチケットの予約システムなどをはじめさまざまな業種に利用されてきた。
【0003】
図6を用いて、従来の電話音声自動応答システムの動作の一例を説明する。電話回線3に接続した不図示の電話と、音声応答装置4との間で着信した電話の呼もしくは発信した電話の呼が確立すると、音声応答装置4は、予め用意してある定型メッセージの発声を指示し、これにより、音声ガイダンスが話者に伝えられる。この音声ガイダンスに従って話者がプッシュボタンまたは発声により指示すると、この話者による音声指示を音声認識部7が受けとる。一般に、音声認識部7はプッシュボタンの認識や話者の発声の認識などの音声認識を行うことができる。音声認識部7は話者の指示内容を解析し、音声応答装置4は、定型メッセージで応答する(例えば、特許文献1参照。)。
【0004】
【特許文献1】
特開平9−330357号公報(第2頁、第2図)
【0005】
【発明が解決しようとする課題】
しかし、従来の音声のみによる自動応答システムは、その応答に時間がかかり、利便性が良くない問題がある。例えば、音声のみのガイダンスであるため、特に操作に不慣れなユーザの場合には誤操作が多くなったり、操作になれたユーザであってもガイダンスを最後まできかないと次の操作に進めずに時間がかかってしまう。また、選択肢の番号をプッシュボタンを押すことによって操作する場合、選択肢が多数あると、ガイダンスを聞いているうちに、最初に発せられた選択肢の内容を忘れてしまう。このような場合の選択肢は、最大でも3つまでが望ましいとされており、選択肢の数を減らすことによって、質問回数が増えていき、さらに時間がかかってしまう。
【0006】
このように、1回のジョブの時間がかかることによって、ユーザに負担を与えるだけでなく、通信コストが増える。また、音声のみであるため、聞き逃しや聞き間違いによって、誤操作が起こりやすいという欠点がある。操作が予想以上長時間におよぶために、ジョブの途中で操作を中断するユーザが増えるという問題もあった。
【0007】
【課題を解決するための手段】
本発明は、上記の課題に鑑みてなされ、第1に、音声通信の機能と画像通信の機能を備えたテレビ電話と送受信を行う仮想テレビ電話端末部と、前記テレビ電話から受信したDTMF信号により該テレビ電話に応答する音声および/または映像の制御を行うシナリオ実行部とを具備することにより解決するものである。
【0008】
また、前記仮想テレビ電話端末部は、前記テレビ電話と接続する通信部と、前記シナリオ実行部からの映像が入力される映像入力部と、前記シナリオ実行部からの音声が入力される音声入力部と、前記シナリオ実行部へDTMF信号を出力するDTMF信号出力部とから構成されることを特徴とするものである。
【0009】
また、前記シナリオ実行部は、前記テレビ電話に応答する前記音声および/または映像を格納するリソース格納部と、前記音声および/または映像を制御する内容を記述したシナリオと、前記音声のデータを合成して前記仮想テレビ電話端末に送信する音声生成部と、前記映像のデータを合成して前記仮想テレビ電話端末に送信する映像生成部と、外部システム、外部装置、外部ソフトウェアの少なくともいずれか1つとデータ通信を行う外部インターフェイス部と、前記リソース格納部、前記シナリオ、前記外部インターフェイス、前記映像生成部および前記音声生成部の制御を行う制御部とを具備することを特徴とするものである。
【0010】
また、前記リソース格納部の前記映像は、予め所定のフォーマットで圧縮されて格納されることを特徴とするものである。
【0011】
また、前記映像生成部は、複数の前記映像を即時に重畳させて配置することを特徴とするものである。
【0012】
また、前記映像生成部は、前記映像にテキストデータを即時に動的に合成することを特徴とするものである。
【0013】
また、前記テレビ電話からの音声を認識する音声認識部を具備し、該音声により前記テレビ電話に応答する音声および/または映像を制御することを特徴とするものである。
【0014】
また、前記テレビ電話からの映像を認識するする映像認識部を具備し、該映像により前記テレビ電話に応答する音声および/または映像を制御することを特徴とするものである。
【0015】
第2に、音声通信の機能と画像通信の機能を備えたテレビ電話と、該テレビ電話と接続し、仮想テレビ電話端末部とシナリオ実行部とを有する自動応答装置とを具備し、仮想テレビ電話端末部で前記テレビ電話からのDTMF信号を受信し、前記シナリオ実行部で音声および/または映像の制御を行い、前記テレビ電話に応答を行うことをにより解決するものである。
【0016】
また、前記仮想テレビ電話端末部は、前記テレビ電話と接続する通信部と、映像入力部と、音声入力部と、DTMF信号出力部とを具備し、前記DTMF信号を前記シナリオ実行部へ出力することにより前記映像入力部には前記シナリオ実行部からの映像が入力され、前記音声入力部には前記シナリオ実行部からの音声が入力されることを特徴とするものである。
【0017】
また、前記シナリオ実行部は、リソース格納部と、シナリオと、音声生成部と、映像生成部と、外部インターフェイス部と、制御部とを具備し、前記DTMF信号により前記シナリオを実行し、前記リソース格納部から前記テレビ電話に応答する前記音声および/または映像を取得し、前記音声生成部により前記音声のデータを合成して前記仮想テレビ電話端末に送信し、前記映像生成部により前記映像のデータを合成して前記仮想テレビ電話端末に送信し、前記テレビ電話に応答することを特徴とするものである。
【0018】
また、前記テレビ電話からの音声を認識する音声認識部を具備し、該音声により前記シナリオを実行することを特徴とするものである。
【0019】
また、前記テレビ電話からの映像を認識する映像認識部を具備し、前記映像により前記シナリオを実行することを特徴とするものである。
【0020】
また、前記リソース格納部の前記映像は、予め所定のフォーマットで圧縮されて格納されることを特徴とするものである。
【0021】
また、前記映像生成部は、複数の前記映像を即時に重畳させて配置することを特徴とするものである。
【0022】
また、前記映像生成部は、前記映像にテキストデータを即時に動的に合成することを特徴とするものである。
【0023】
また、前記テレビ電話および前記自動応答装置は、公衆電話回線、専用電話回線、IPネットワークのいずれかにより接続することを特徴とするものである。
【0024】
また、前記テレビ電話はテレビ機能付き携帯電話であり、ゲートウェイ装置および前記電話回線を介して前記自動応答装置と接続することを特徴とするものである。
【0025】
第3に、音声通信の機能と画像通信の機能を備えたテレビ電話と、該テレビ電話と接続し、仮想テレビ電話端末部とシナリオ実行部とを有する自動応答装置と、前記自動応答装置に接続する外部装置を具備し、前記テレビ電話からDTMF信号を受信し、前記シナリオ実行部に保持されるシナリオに従って音声および/または映像を制御し、前記テレビ電話に応答することで銀行業務を行うことにより解決するものである。
【0026】
また、前記記仮想テレビ電話端末部は、前記テレビ電話と接続する通信部と、映像入力部と、音声入力部と、DTMF信号出力部とを具備し、前記DTMF信号を前記シナリオ実行部へ出力することにより前記映像入力部には前記シナリオ実行部からの映像が入力され、前記音声入力部には前記シナリオ実行部からの音声が入力されることを特徴とするものである。
【0027】
また、前記シナリオ実行部は、リソース格納部と、シナリオと、音声生成部と、映像生成部と、外部インターフェイス部と、制御部とを具備し、前記DTMF信号により前記音声および/または映像を制御する内容を記述したシナリオを実行し、前記テレビ電話に応答する音声および/またはデータをリソース格納部から取得し、前記音声生成部により前記音声のデータを合成して前記仮想テレビ電話端末に送信し、前記映像生成部により前記映像のデータを合成して前記仮想テレビ電話端末に送信し、前記外部インターフェイスにより接続する前記外部装置あるいは外部システム、外部ソフトウェアのいずれかとデータ通信を行い、前記テレビ電話に応答することを特徴とするものである。
【0028】
また、前記シナリオ実行部は、前記テレビ電話からの音声を認識する音声認識部を具備し、前記音声により前記シナリオを実行することを特徴とするものである。
【0029】
また、前記シナリオ実行部は、前記テレビ電話からの映像を認識する映像認識部を具備し、前記映像を認識して前記シナリオを実行することを特徴とするものである。
【0030】
また、前記リソース格納部の前記映像は、所定のフォーマットで圧縮されて格納されることを特徴とするものである。
【0031】
また、前記映像生成部は、前記リソース格納部に保持される複数の前記映像を即時に重畳させて配置することを特徴とするものである。
【0032】
また、前記映像生成部は、前記リソース格納部に保持される前記映像にテキストデータを即時に動的に合成することを特徴とするものである。
【0033】
また、前記テレビ電話および前記自動応答装置は、公衆電話回線、専用電話回線、IPネットワークのいずれかにより接続することを特徴とするものである。
【0034】
また、前記テレビ電話はテレビ機能付き携帯電話であり、ゲートウェイ装置および前記電話回線を介して前記自動応答装置と接続することを特徴とするものである。
【0035】
【発明の実施の形態】
図1から図5を用いて、本発明の実施形態を詳細に説明する。
【0036】
図1には、自動応答装置10の概要図を示す。本発明の自動応答装置10は、仮想テレビ電話端末部11と、シナリオ実行部12とから構成される。
【0037】
仮想テレビ電話端末部11は、自動応答装置10内にテレビ電話プロトコルを実装するための手段であり、通信部13、映像入力部14、DTMF出力部15、音声入力部16とからなる。通信部13は、音声通信の機能と画像通信の機能を備えたテレビ電話28と接続し、送受信を行う。映像入力部14は、テレビ電話28に応答するため、シナリオ実行部12のシナリオ21に従ってリソース格納部24から呼び出された映像が入力される。音声入力部16は、同様にテレビ電話28に応答するため、シナリオ実行部12のシナリオ21に従ってリソース格納部24から呼び出された音声が入力される。DTMF出力部15は、テレビ電話端末28からのDTMF信号を、シナリオ実行部12の制御部22へ出力する。
【0038】
また、シナリオ実行部12は、映像生成部19、音声生成部20、シナリオ21、制御部22、外部インターフェイス部23、リソース格納部24とからなる。シナリオ21は、テレビ電話28から発せられるDTMF信号によって制御する音声および/または映像の処理内容を記述したものである。
【0039】
リソース格納部24には、応答用の音声や映像がデータとして格納される。ここで、映像とは、静止画および動画をいい、応答する音声と連動した選択肢やメニュー、操作方法等のガイダンスを視覚的に表示する画像データである。
【0040】
また、指定されたフォーマットに映像のデータを圧縮するエンコード機能は保持せず、加工が容易なエンコード済みのデータを用意しておくおことで多重化(同時アクセス)に対応する。
【0041】
リソース格納部24の映像のデータはシナリオ21を作成する例えばGUIツールにおいて、予め所定のフォーマットに圧縮されて格納される。外部インターフェイス部23は、自動応答装置10に接続する外部装置、外部システム、外部ソフトウェア等27がある場合に、これらとデータ通信を行う。
【0042】
映像生成部19は、音声の応答ガイダンスに合わせてその内容を視覚的に表示するためにリソース格納部24の映像データの合成・生成を即時に行う。例えば「リソース格納部24に保持される複数の映像データを重ねて配置する」、とのシナリオを解釈して、複数の映像をリアルタイムで合成し、映像を仮想テレビ電話端末部11の映像入力部14へ送信する。また、長文の応答メッセージを表示するような場合に、「背景となる映像上にテキストデータをテロップ形式で表示する」、などのシナリオを解釈し、映像にテキストデータをリアルタイムで動的に表示するよう合成し、映像を映像入力部14へ送信する。
【0043】
音声生成部20は、例えばユーザが選択した操作を復唱するような場合に、「予め格納されている定型の音声とユーザの選択肢を組み合わせて応答する」などのシナリオを解釈してリソース格納部24の音声データの合成・生成をリアルタイムで行い、合成した音声を仮想テレビ電話端末部11の音声入力部16へ送信する。
【0044】
本実施形態の自動応答装置では、音声入力部16および/または映像入力部14に入力された音声データおよび/または映像データは、通信部13からテレビ電話端末28に送信され、音声ガイダンスだけでなく、それに合わせた映像ガイダンスも表示できる。また、応答に合わせて、複数の映像を即時に重ね合わせて表示したり、テキストデータを映像の上に動的あるいは静的に即時に表示することもできる。これにより、現実の会話に近い応答が可能となり、誤動作の防止や、応答時間の短縮が実現できる。
【0045】
ここで、図2の如く、本実施形態の自動応答装置に音声や映像の認識機能を付加しても良い。すなわち、仮想テレビ電話端末部11に、音声出力部18および映像出力部17を設け、シナリオ実行部12に音声認識部26および映像認識部25を設ける。なお、音声または映像のどちらか一方の認識機能でもよい。
【0046】
音声出力部18は、テレビ電話端末28からの音声(指示)を音声認識部26に出力し、音声認識部26では音声を解読して、シナリオが実行できる形式に変換する。
【0047】
映像出力部17は、、テレビ電話端末28からの映像(指示)を映像認識部25に出力し、映像認識部25では映像を解読して、シナリオが実行できる形式に変換する。
【0048】
他の構成は図1に示す自動応答装置と同様であるので説明は省略するが、DTMF信号に加えて、音声および/または映像でガイダンスに対して応答することができ、それを認識してシナリオを実行させることができる。すなわち、予め用意された選択肢での応答だけでなく、汎用性の広い応答をすることが可能となる。
【0049】
次に、図2および図3を用いて、本発明の自動応答システムについて説明する。なお、本実施形態のシステム構成図は図2の如く、テレビ電話端末28と自動応答装置10を回線により接続し、必要に応じて外部装置、または外部ソフトウェア、外部システム等27に接続したものである。また、この自動応答システムにおいて認識機能を必要としなければ、自動応答装置10は図1に示す構造であっても良い。図3は、本実施形態の自動応答システムのフロー図である。
【0050】
まず、テレビ電話端末28から指定された処理を行うための電話番号を発信する(ステップS1)。自動応答装置10で電話の呼び出しを着信すると仮想テレビ電話端末部11が応答し(ステップS2)、テレビ電話端末28が発信するDTMF信号を制御部22に送信する(ステップS3)。これによりシナリオ21が起動され(ステップS4)、シナリオ21に記述された最初の応答ガイダンスとなる音声および/または映像をリソース格納部24から読み出す(ステップS5)。読み出された音声および/または映像は、音声生成部18および映像生成部17で即時に合成され(ステップS6)、音声入力部16、映像入力部14に送信される(ステップS7)。通信部13は最初の応答ガイダンスとなる音声、映像をテレビ電話端末28に送信する(ステップS8)。
【0051】
ユーザはテレビ電話端末28に表示され、音声ガイダンスに合わせた映像を認識し、そのガイダンスに応じてプッシュボタンでDTMF信号を送信して応答する。あるいは、音声、映像を送信して、ガイダンスに応答する。
【0052】
テレビ電話端末28から音声の応答があった場合(ステップS10)には、音声出力部18から音声認識部26に音声が送られ、シナリオが解読できる形式に変換後、制御部22へ送られ(ステップS11)、それに応じたシナリオが実行される(ステップS4)。
【0053】
テレビ電話端末28から映像の応答があった場合(ステップS12)には、映像出力部17から映像認識部25に映像が送られ、シナリオが解読できる形式に変換後、制御部22へ送られ(ステップS13)、それに応じたシナリオが実行される(ステップS4)。
【0054】
尚、音声・映像のデータ生成(ステップS6)において、映像生成部20では現在表示中のガイダンス上にユーザの応答をテキストデータで即時に重ねて表示するような合成を行うことができる。また、テレビ電話端末28の表示部に表示できる文字数は制限があるので、長文のテキストの場合には、映像上にテロップ形式で表示するような合成も可能であり、ユーザが改ページ処理をする必要が無くなる。また、音声や映像でその応答を復唱してもよい。
【0055】
更に、入力待ちモードになっている場合には、テレビ電話端末28のプッシュボタンによりDTMF信号を発生させると、シナリオに従って、処理を継続させることができる。
【0056】
図4には、本実施形態の自動応答システムの接続例を示す。一例として、テレビ電話端末28は、IPネットワーク上の電話プロトコル(例えばH.323)を用いてインターネット31を介して自動応答装置10と接続したり(図4(A))、更に外部システムのホストコンピュータ27とLANにより接続してもよい(図4(B))。
【0057】
またISDNにおけるテレビ電話プロトコル(例えばH.320)等を用いてISDN網32を介して自動応答装置10と接続したり(図4(C))、モバイル環境におけるテレビ電話プロトコル(例えばH.324)や、3G携帯電話(WCDMA)におけるテレビ電話の標準プロトコル(例えば3G−324M)を用いて3G携帯電話網33とインターネット31を介して接続しても良い(図4(D))。H.324や、3G−324M等のプロトコルを利用する場合には、モバイル環境や3G携帯電話網33とインターネット31上の電話プロトコルとを変換するゲートウェイ装置34を更に設ける。
【0058】
ここで、電話プロトコルは仮想テレビ電話端末部11に実装されるので、接続する回線により、電話プロトコルの実装部は適宜選択する。
【0059】
この自動応答システムは、電話で銀行の照会および取引業務を行うテレフォンバンキングシステム、チケット予約システム等の予約業務、あるいは、動画を利用して家電製品やパソコン等の操作説明を行うユーザサポート業務等、さまざまな業種に利用することができる。
【0060】
また、初期画面でWEB上のコンテンツを選択できるような構成にしておくことも可能である。これにより、1つの電話番号に対して1つの業務だけでなく、様々な業務を選択して実行することができる。
【0061】
図5は、上記の自動応答システムを、テレフォンバンキングシステムに適用した場合の、各処理における画面遷移の一例を示す。
【0062】
上述の如く、本実施形態は、テレフォンバンキングの取引、照会業務等を行うシステムに用いると好適である。ここで、システム構成図は図2とほぼ同様であるが、自動応答装置は、外部インターフェイスにより銀行のホストコンピュータ27とLAN接続しているとする。それ以外の構成要素は前述と同様であるので説明は省略する。また、図3の処理フロー図とあわせ、図5を説明する。
【0063】
まず、テレビ電話端末28からテレフォンバンキングシステムの電話番号を発信し、自動応答装置10で電話の呼び出しを着信すると仮想テレビ電話端末部11が応答し、テレビ電話端末28が発信するDTMF信号を制御部22に送信する(図3:ステップS1〜S3)。これによりテレフォンバンキングシステムのシナリオ21が起動され、シナリオ21に記述された最初の応答ガイダンスとなる音声および/または映像をリソース格納部24から読み出す(図3:ステップS4〜S5)。例えばこのとき、処理の開始と初期メニューを伝える映像と、それに合わせた音声のファイルを選択する。
【0064】
読み出された音声および/または映像は、音声生成部18および映像生成部17で合成され、音声入力部16、映像入力部14に送信される。通信部13は最初の応答ガイダンスとなる音声、映像をテレビ電話端末28に送信する(図3:ステップS6〜S8)。
【0065】
このとき、ユーザのテレビ電話端末に表示される映像と音声が、図5(A)に示すものである。銀行業務の初期画面であるので、図の如く例えば「振込」、「振為」、「残高照会」等のメニューが表示される。
【0066】
ユーザはテレビ電話端末28に表示され、音声ガイダンスに合わせた映像を認識し、そのガイダンスに応じてプッシュボタンでDTMF信号を送信して応答する(図3:ステップ2)。例えば振り込みであれば、「1」を選択し、DTMF信号信号が制御部に送信され、「振り込み」を選択した場合のシナリオが実行される(図3:ステップS4)。
【0067】
また、音声認識機能付きの場合は「振り込み」と音声入力しても良いし、映像認識機能付きの場合は、「振り込み」と発声している映像を入力しても良い。音声であれば、音声出力部18から音声認識部26に音声が送られ、シナリオが解読できる形式に変換後、制御部22へ送られ(図3:ステップS10〜S11)、「振り込み」を選択した場合のシナリオが実行される(図3:ステップS4)。映像の応答があった場合には、映像出力部17から映像認識部25に映像が送られ、シナリオが解読できる形式に変換後、制御部22へ送られ(図3:ステップS12〜S13)、「振り込み」を選択した場合のシナリオが実行される(図3:ステップS4)。
【0068】
メニューが選択された場合には、その選択を確認する応答をするとよい。例えば、図5(B)の如く、振り込みで良いかを視覚的に確認しまた復唱するような映像、音声のデータを即時に合成し(図3:ステップS5〜S6)、ユーザに応答する(図3:ステップS8)。
【0069】
このように、ユーザからの指示と、自動応答装置の応答とを繰り返し、図5(C)の如く「振込先の金融機関の選択」や、図5(D)のごとく「振込先金融機関の頭文字の選択」等のガイダンスを、音声や映像を合成して表示する。例えば図5(D)のように、選択肢が多くなっても、音声と映像の両方でガイダンスすることにより、音声を最後まで聞かなくても操作ができる。また、聞き逃し、聞き違い等を防げるので、誤操作を低減することができる。更に、このとき、テレビ電話端末の表示部で表示できる文字数を超えるような場合には、テキストデータをテロップ形式で繰り返し表示させるようにデータを作成してもよい。
【0070】
その後、「振り込み」であれば振り込み人の情報や、振込金額の入力を促す音声、映像をテレビ電話端末に応答する。ユーザから入力されるこれらの情報(ユーザ情報)は、プッシュボタンの1つを選択肢として押下する様な場合と異なり、誤動作防止のための入力確認の重要度は大きい。また、ユーザ情報は予測できないデータであり、リソース格納部に予め保持することは不可能である。本実施形態では、映像生成部や音声生成部において、入力されたユーザ情報とリソース格納部に保持される定型メッセージを、即時に重ねて配置するようなデータや、音声を即時に合成したデータを作成することができる。例えば、図5(E)の如く、定型メッセージとして「振込金額は」「円です。」を表示させ、ユーザ情報である金額「2,100」をテキストとして即時に重ねて表示する。音声も「振込金額は・・・円ですね。正しい場合は1を間違っている場合は0を押してください。」というような定型メッセージに「2100」という音声を合成したデータを作成し、応答する。
【0071】
このように、映像や音声の合成が即時に行えるため、現実の会話に近い応答が可能となり、誤動作の防止や、応答時間の短縮が実現でき、操作性を大幅に向上したテレフォンバンキングシステムを提供できる。
【0072】
【発明の効果】
本発明によれば、以下の様々な効果が得られる。
【0073】
第1に、映像(動画)および/または音声によるガイダンスでエンドユーザの理解度が大幅に向上し、誤操作が減る。
【0074】
第2に、画面上にガイダンスの内容を表示することによって、ガイダンスを最後まで聞かなくても一覧して次の操作を判断できる。
【0075】
第3に、視覚的に確認できるため選択肢を多くすることができ、1回のジョブが完了する時間を短縮でき、通信コストを下げることができる。
【0076】
第4に、リソース格納部に保持される定型のメッセージ以外の、ユーザから入力される予測しにくい情報を、定型メッセージと即時に重ねて表示するよう映像を合成したり、音声合成して応答できる。これにより、常に入力情報をユーザに確認させることができ、また現実の会話に近い応答が可能となるので誤操作を防止でき、業務の信頼度を向上させることができる。
【0077】
第5に、テレビ電話端末としてテレビ電話機能付き携帯電話を用いることにより、時間的、場所的な拘束がなくなり、利便性が向上する。
【0078】
第6に、音声のみ、映像のみでは不便であるような状況下でも音声と映像でガイダンスすることにより、誤操作を防止できる。
【図面の簡単な説明】
【図1】本発明の自動応答装置を説明する構成図である。
【図2】本発明の自動応答装置を説明する構成図である。
【図3】本発明の自動応答システムを説明するフロー図である。
【図4】本発明の自動応答システムを説明する概要図である。
【図5】本発明のテレフォンバンキングシステムを説明する画面遷移図である。
【図6】従来の自動応答システムを説明する概要図である。
【符号の説明】
3 電話回線
4 音声応答装置
7 音声認識部
10 自動応答装置
11 仮想テレビ電話端末部
12 シナリオ実行部
13 通信部
14 映像入力部
15 DTMF出力部
16 音声入力部
17 映像出力部
18 音声出力部
19 映像生成部
20 音声生成部
21 シナリオ
22 制御部
23 外部インターフェイス部
24 リソース格納部
25 映像認識部
26 音声認識部
28 テレビ電話
31 インターネット
32 ISDN網
33 3G携帯電話網
34 ゲートウェイ装置

Claims (28)

  1. 音声通信の機能と画像通信の機能を備えたテレビ電話と送受信を行う仮想テレビ電話端末部と、
    前記テレビ電話から受信したDTMF信号により該テレビ電話に応答する音声および/または映像の制御を行うシナリオ実行部とを具備することを特徴とするする自動応答装置。
  2. 前記仮想テレビ電話端末部は、
    前記テレビ電話と接続する通信部と、
    前記シナリオ実行部からの映像が入力される映像入力部と、
    前記シナリオ実行部からの音声が入力される音声入力部と、
    前記シナリオ実行部へDTMF信号を出力するDTMF信号出力部とから構成されることを特徴とする請求項1に記載の自動応答装置。
  3. 前記シナリオ実行部は、前記テレビ電話に応答する前記音声および/または映像を格納するリソース格納部と、
    前記音声および/または映像を制御する内容を記述したシナリオと、
    前記音声のデータを合成して前記仮想テレビ電話端末に送信する音声生成部と、
    前記映像のデータを合成して前記仮想テレビ電話端末に送信する映像生成部と、
    外部システム、外部装置、外部ソフトウェアの少なくともいずれか1つとデータ通信を行う外部インターフェイス部と、
    前記リソース格納部、前記シナリオ、前記外部インターフェイス、前記映像生成部および前記音声生成部の制御を行う制御部とを具備することを特徴とする請求項1に記載の自動応答装置。
  4. 前記リソース格納部の前記映像は、予め所定のフォーマットで圧縮されて格納されることを特徴とする請求項3に記載の自動応答装置。
  5. 前記映像生成部は、複数の前記映像を即時に重畳させて配置することを特徴とする請求項3に記載の自動応答装置。
  6. 前記映像生成部は、前記映像にテキストデータを即時に動的に合成することを特徴とする請求項3に記載の自動応答装置。
  7. 前記テレビ電話からの音声を認識する音声認識部を具備し、該音声により前記テレビ電話に応答する音声および/または映像を制御することを特徴とする請求項1に記載の自動応答装置。
  8. 前記テレビ電話からの映像を認識するする映像認識部を具備し、該映像により前記テレビ電話に応答する音声および/または映像を制御することを特徴とする請求項1に記載の自動応答装置。
  9. 音声通信の機能と画像通信の機能を備えたテレビ電話と、
    該テレビ電話と接続し、仮想テレビ電話端末部とシナリオ実行部とを有する自動応答装置とを具備し、
    仮想テレビ電話端末部で前記テレビ電話からのDTMF信号を受信し、前記シナリオ実行部で音声および/または映像の制御を行い、前記テレビ電話に応答を行うことを特徴とする自動応答システム。
  10. 前記仮想テレビ電話端末部は、前記テレビ電話と接続する通信部と、映像入力部と、音声入力部と、DTMF信号出力部とを具備し、
    前記DTMF信号を前記シナリオ実行部へ出力することにより前記映像入力部には前記シナリオ実行部からの映像が入力され、前記音声入力部には前記シナリオ実行部からの音声が入力されることを特徴とする請求項9に記載の自動応答システム。
  11. 前記シナリオ実行部は、リソース格納部と、シナリオと、音声生成部と、映像生成部と、外部インターフェイス部と、制御部とを具備し、前記DTMF信号により前記音声および/または映像を制御する内容を記述したシナリオを実行し、前記リソース格納部から前記テレビ電話に応答する前記音声および/または映像を取得し、前記音声生成部により前記音声のデータを合成して前記仮想テレビ電話端末に送信し、前記映像生成部により前記映像のデータを合成して前記仮想テレビ電話端末に送信し、前記テレビ電話に応答することを特徴とする請求項9に記載の自動応答システム。
  12. 前記テレビ電話からの音声を認識する音声認識部を具備し、該音声により前記シナリオを実行することを特徴とする請求項11に記載の自動応答システム。
  13. 前記テレビ電話からの映像を認識する映像認識部を具備し、前記映像により前記シナリオを実行することを特徴とする請求項11に記載の自動応答システム。
  14. 前記リソース格納部の前記映像は、予め所定のフォーマットで圧縮されて格納されることを特徴とする請求項11に記載の自動応答システム。
  15. 前記映像生成部は、複数の前記映像を即時に重畳させて配置することを特徴とする請求項11に記載の自動応答システム。
  16. 前記映像生成部は、前記映像にテキストデータを即時に動的に合成することを特徴とする請求項11に記載の自動応答システム。
  17. 前記テレビ電話および前記自動応答装置は、公衆電話回線、専用電話回線、IPネットワークのいずれかにより接続することを特徴とする請求項9に記載の自動応答システム。
  18. 前記テレビ電話はテレビ機能付き携帯電話であり、ゲートウェイ装置および前記電話回線を介して前記自動応答装置と接続することを特徴とする請求項9に記載の自動応答システム。
  19. 音声通信の機能と画像通信の機能を備えたテレビ電話と、該テレビ電話と接続し、仮想テレビ電話端末部とシナリオ実行部とを有する自動応答装置と、前記自動応答装置に接続する外部装置を具備し、
    前記テレビ電話からDTMF信号を受信し、前記シナリオ実行部で音声および/または映像を制御し、前記テレビ電話に応答することで銀行業務を行うテレフォンバンキングシステム。
  20. 前記仮想テレビ電話端末部は、前記テレビ電話と接続する通信部と、映像入力部と、音声入力部と、DTMF信号出力部とを具備し、
    前記DTMF信号を前記シナリオ実行部へ出力することにより前記映像入力部には前記シナリオ実行部からの映像が入力され、前記音声入力部には前記シナリオ実行部からの音声が入力されることを特徴とする請求項19に記載のテレフォンバンキングシステム。
  21. 前記シナリオ実行部は、リソース格納部と、シナリオと、音声生成部と、映像生成部と、外部インターフェイス部と、制御部とを具備し、
    前記DTMF信号により前記音声および/または映像を制御する内容を記述したシナリオを実行し、前記テレビ電話に応答する音声および/またはデータをリソース格納部から取得し、前記音声生成部により前記音声のデータを合成して前記仮想テレビ電話端末に送信し、前記映像生成部により前記映像のデータを合成して前記仮想テレビ電話端末に送信し、前記外部インターフェイスにより接続する前記外部装置あるいは外部システム、外部ソフトウェアのいずれかとデータ通信を行い、前記テレビ電話に応答することを特徴とする請求項19に記載のテレフォンバンキングシステム。
  22. 前記シナリオ実行部は、前記テレビ電話からの音声を認識する音声認識部を具備し、前記音声により前記シナリオを実行することを特徴とする請求項21に記載のテレフォンバンキングシステム。
  23. 前記シナリオ実行部は、前記テレビ電話からの映像を認識する映像認識部を具備し、前記映像を認識して前記シナリオを実行することを特徴とする請求項21に記載のテレフォンバンキングシステム。
  24. 前記リソース格納部の前記映像は、所定のフォーマットで圧縮されて格納されることを特徴とする請求項21に記載のテレフォンバンキングシステム。
  25. 前記映像生成部は、前記リソース格納部に保持される複数の前記映像を即時に重畳させて配置することを特徴とする請求項21に記載のテレフォンバンキングシステム。
  26. 前記映像生成部は、前記リソース格納部に保持される前記映像にテキストデータを即時に動的に合成することを特徴とする請求項21に記載のテレフォンバンキングシステム。
  27. 前記テレビ電話および前記自動応答装置は、公衆電話回線、専用電話回線、IPネットワークのいずれかにより接続することを特徴とする請求項19に記載のテレフォンバンキングシステム。
  28. 前記テレビ電話はテレビ機能付き携帯電話であり、ゲートウェイ装置および前記電話回線を介して前記自動応答装置と接続することを特徴とする請求項19に記載のテレフォンバンキングシステム。
JP2003151460A 2003-05-28 2003-05-28 自動応答装置およびそれを用いた自動応答システム、テレフォンバンキングシステム Pending JP2004356896A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003151460A JP2004356896A (ja) 2003-05-28 2003-05-28 自動応答装置およびそれを用いた自動応答システム、テレフォンバンキングシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003151460A JP2004356896A (ja) 2003-05-28 2003-05-28 自動応答装置およびそれを用いた自動応答システム、テレフォンバンキングシステム

Publications (2)

Publication Number Publication Date
JP2004356896A true JP2004356896A (ja) 2004-12-16
JP2004356896A5 JP2004356896A5 (ja) 2006-06-29

Family

ID=34046978

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003151460A Pending JP2004356896A (ja) 2003-05-28 2003-05-28 自動応答装置およびそれを用いた自動応答システム、テレフォンバンキングシステム

Country Status (1)

Country Link
JP (1) JP2004356896A (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006254334A (ja) * 2005-03-14 2006-09-21 Ntt Docomo Inc サービス通知装置、及び、サービス通知方法
JP2007104071A (ja) * 2005-09-30 2007-04-19 Mizuho Bank Ltd 音声ガイドシステム及び音声ガイド方法
JP2007159142A (ja) * 2005-12-08 2007-06-21 Internatl Business Mach Corp <Ibm> コールセンターサービスの音声ビューを視覚的にナビゲートする方法、コールセンター及びコンピュータ・プログラム
JP2008219903A (ja) * 2007-03-07 2008-09-18 Agere Systems Inc 音声およびデータ接続を並列で扱うための通信サーバおよびこれを使用する方法
JP2009010478A (ja) * 2007-06-26 2009-01-15 So-Net Entertainment Corp コールバック管理装置
JP2009182836A (ja) * 2008-01-31 2009-08-13 Oki Electric Ind Co Ltd コールセンタ装置
JP2009213056A (ja) * 2008-03-06 2009-09-17 Ntt Docomo Inc 音声自動応答装置、音声自動応答方法、音声自動応答プログラム
JP2013541872A (ja) * 2010-08-24 2013-11-14 コール ゲイト カンパニー リミテッド 音声−画面arsサービスシステム及びその提供方法とコンピュータ読取可能な記録媒体
JP2013251699A (ja) * 2012-05-31 2013-12-12 Shunji Sugaya 音声自動応答システムの関連データを受信する電化製品、音声自動応答システムの関連データ取得方法、及び、プログラム
JP2016524886A (ja) * 2014-06-24 2016-08-18 シャオミ・インコーポレイテッド 音声サービス取得方法、装置、プログラム、及び記録媒体
US9560200B2 (en) 2014-06-24 2017-01-31 Xiaomi Inc. Method and device for obtaining voice service
JP2017538327A (ja) * 2014-10-23 2017-12-21 ゼットティーイー コーポレーションZte Corporation 通話処理方法及び装置

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006254334A (ja) * 2005-03-14 2006-09-21 Ntt Docomo Inc サービス通知装置、及び、サービス通知方法
JP4559335B2 (ja) * 2005-09-30 2010-10-06 株式会社みずほ銀行 音声ガイドシステム及び音声ガイド方法
JP2007104071A (ja) * 2005-09-30 2007-04-19 Mizuho Bank Ltd 音声ガイドシステム及び音声ガイド方法
JP2007159142A (ja) * 2005-12-08 2007-06-21 Internatl Business Mach Corp <Ibm> コールセンターサービスの音声ビューを視覚的にナビゲートする方法、コールセンター及びコンピュータ・プログラム
JP2008219903A (ja) * 2007-03-07 2008-09-18 Agere Systems Inc 音声およびデータ接続を並列で扱うための通信サーバおよびこれを使用する方法
JP2009010478A (ja) * 2007-06-26 2009-01-15 So-Net Entertainment Corp コールバック管理装置
JP2009182836A (ja) * 2008-01-31 2009-08-13 Oki Electric Ind Co Ltd コールセンタ装置
JP2009213056A (ja) * 2008-03-06 2009-09-17 Ntt Docomo Inc 音声自動応答装置、音声自動応答方法、音声自動応答プログラム
JP2013541872A (ja) * 2010-08-24 2013-11-14 コール ゲイト カンパニー リミテッド 音声−画面arsサービスシステム及びその提供方法とコンピュータ読取可能な記録媒体
JP2013251699A (ja) * 2012-05-31 2013-12-12 Shunji Sugaya 音声自動応答システムの関連データを受信する電化製品、音声自動応答システムの関連データ取得方法、及び、プログラム
JP2016524886A (ja) * 2014-06-24 2016-08-18 シャオミ・インコーポレイテッド 音声サービス取得方法、装置、プログラム、及び記録媒体
US9560200B2 (en) 2014-06-24 2017-01-31 Xiaomi Inc. Method and device for obtaining voice service
JP2017538327A (ja) * 2014-10-23 2017-12-21 ゼットティーイー コーポレーションZte Corporation 通話処理方法及び装置

Similar Documents

Publication Publication Date Title
US5491743A (en) Virtual conference system and terminal apparatus therefor
EP2002422B1 (en) Method and apparatus to provide data to an interactive voice response (ivr) system
US8169462B2 (en) Mobile communication device capable of storing video chatting log and operating method thereof
US20050146598A1 (en) Internet video conferencing on a home television
US20060001737A1 (en) Video conference arrangement
CA2415059A1 (en) Advanced set top terminal having a video call feature
JP2004356896A (ja) 自動応答装置およびそれを用いた自動応答システム、テレフォンバンキングシステム
EP1019854B1 (en) System for obtaining assistance in operating an apparatus
US20080043418A1 (en) Video communication apparatus using VoIP and method of operating the same
US8269815B2 (en) Dynamic image distribution device and method thereof
KR20090054609A (ko) 감정적 콘텐츠 효과를 포함하는 전화 통신 서비스를제공하는 VoIP 전화 통신 시스템 및 방법
US11595509B2 (en) Telecommunications soft client having a GUI-less operating mode
JP2002044285A (ja) 移動体通信端末装置および携帯表示端末装置
JP5321247B2 (ja) シンクライアントシステム、シンクライアントシステムの制御方法、シンクライアント端末の制御プログラム及びサーバの制御プログラム
JP3276404B2 (ja) 端末データ入出力方法及び装置
US20090006090A1 (en) Image communication apparatus and control method of the same
KR100584352B1 (ko) 동영상 전화장치의 영상 송,수신 제어방법
JP3589702B2 (ja) 通信端末装置
JP6659066B1 (ja) 音声通話システム、音声通話制御装置、音声通話プログラム、及び音声通話方法
JP2002032241A (ja) 携帯電話用コンテンツのデバッグ方法およびデバッグ装置
KR101806507B1 (ko) 인터넷전화 기능을 갖는 일체형 컴퓨터 장치
JP2006245812A (ja) 画像応答機能を有する留守番電話装置
JP2005038067A (ja) 音声入力機能を備えたフォームを提供する電子フォームシステム
JP3982307B2 (ja) 文字入力装置
JP2004320796A (ja) 通信端末装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060517

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060519

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090217

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090714