JP5947156B2 - 音声ガイダンスサーバ、音声ガイダンス方法、音声ガイダンスプログラム、音声ガイダンスシステム - Google Patents

音声ガイダンスサーバ、音声ガイダンス方法、音声ガイダンスプログラム、音声ガイダンスシステム Download PDF

Info

Publication number
JP5947156B2
JP5947156B2 JP2012189284A JP2012189284A JP5947156B2 JP 5947156 B2 JP5947156 B2 JP 5947156B2 JP 2012189284 A JP2012189284 A JP 2012189284A JP 2012189284 A JP2012189284 A JP 2012189284A JP 5947156 B2 JP5947156 B2 JP 5947156B2
Authority
JP
Japan
Prior art keywords
voice
guidance
terminal device
communication session
transition state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012189284A
Other languages
English (en)
Other versions
JP2014049830A (ja
Inventor
悠 古城
悠 古城
葉子 飯村
葉子 飯村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2012189284A priority Critical patent/JP5947156B2/ja
Publication of JP2014049830A publication Critical patent/JP2014049830A/ja
Application granted granted Critical
Publication of JP5947156B2 publication Critical patent/JP5947156B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Description

本発明は音声ガイダンスに関し、特に電話端末等を用いたユーザと、サーバとの間で、双方向のコミュニケーションを実現する音声ガイダンスサーバ、音声ガイダンス方法、音声ガイダンスプログラム、音声ガイダンスシステムに関する。
近年、留守番電話やボイスメール等のサービスを提供する対話型シナリオサービスが知られている。この対話型シナリオサービスとは、ユーザからのプッシュボタン(以下、PBと略す)音、または、PB音に相当する音声による操作をサーバが受け付ける。そして、このサーバからユーザ向けにガイダンスを送信するほか、ユーザからの音声にも応答し、対話型のコミュニケーションを進めながら、ユーザの目的を達成しやすいという、インタラクティブ(interactive)なサービスである。なお、コンピュータ用語としてのインタラクティブとは、電話、ケーブルテレビ、等の双方向的な電子通信システムや、Webサイトを運営する企業側とユーザとの間に双方向のコミュニケーションが存在していること、ユーザの選択に応じて、表示される画面等情報の内容が刻々と変化すること、といった意味である。
また、対話型システムでは、プッシュボタン信号(以下、PB信号ともいう)送出手段により、外線通話中にダイヤルボタンを押して、通話の相手にPB信号を送出させることが可能である。PB信号送出部は、例えば、チケットセンターでのチケット購入時のほか、不在配達物を配送センターに再配達依頼する時、あるいは、お客様センター等への問い合わせの際に、音声ガイダンスを操作する手段としてよく用いられている。
また、音声蓄積サーバに蓄積された音声情報と、データ利用サーバに蓄積されたデータ情報とを結びつける方法等が知られている(特許文献1)。すなわち、音声蓄積サーバは、端末装置から受信する音声情報を録音すると共に、端末装置の電話番号と音声着信時刻とを音声関連情報として格納し、データ利用サーバは、データ情報と、前記音声情報が前記端末装置から送出される時刻より前の時刻である第1の時刻と、音声録音終了より後の時刻である第2の時刻と、前記電話番号とを含む端末装置送信データを端末装置から受信し、音声蓄積サーバにアクセスすることにより、前記端末装置送信データに含まれる前記電話番号と同じ電話番号を含み、かつ、前記第1の時刻より後であり前記第2の時刻より前である音声着信時刻を含む音声関連情報を抽出し、当該音声関連情報に対応する音声情報を取得し、当該音声情報と前記データ情報とを対応付けて利用データ格納手段に格納するという方法である。
特許文献1に開示された方法によれば、携帯電話機から音声通信経路を経由して音声蓄積サーバに蓄積された音声情報と、当該携帯電話機からデータ通信経路を経由してデータ利用サーバに蓄積されたデータ情報とを結びつけるための技術を、既存の音声蓄積サーバ及び携帯電話機に対して大きな機能追加等を施すことなく実現することが可能となる。
特開2008−104080号公報
一方、特許文献1とは異なり、音声信号のみで情報をやり取りする対話型シナリオサービスも知られている。この音声情報のみによる対話型シナリオサービスや特許文献1に記載の技術は、音声ガイダンスを聞きながら、それと同一内容の文字/画像による支援を受けることはできなかった。したがって、遂次にしか聞けない音声ガイダンスを提供するだけでは、ユーザの対応に誤りを招来しがちであるという問題があった。
本発明は上述した背景技術の問題を解決することを目的としてなされたものであり、同一ガイダンスの内容を、音声通信セッションと、パケット通信セッションとの両方を併用して提供し、ユーザ誤りを防ぐことが可能な音声ガイダンスサーバ、音声ガイダンス方法、音声ガイダンスプログラム、音声ガイダンスシステムを提供することを目的としている。
本発明の一態様にかかる音声ガイダンスサーバは、端末装置へ対話式で音声ガイダンスを提供可能な音声ガイダンスサーバであって、前記端末装置との間で音声通信セッションを介して音声ガイダンスを音声信号として送受信する音声送受信部と、前記端末装置と自サーバとの間に、予め確立された音声通信セッションに加えてパケット通信セッションを確立すべきか否かを判断するパケット通信セッション確立判断部と、前記パケット通信セッション確立判断部により前記パケット通信セッションを確立すべきと判断された場合に、前記端末装置から前記パケット通信セッションの確立を要求させるパケット通信セッション確立指令を前記端末装置に通知するパケット通信セッション確立指令部と、前記端末装置との間で確立されたパケット通信セッションを介してガイダンス文言・フローなどが含まれたテキスト/画像をパケットデータとして送受信するパケット送受信部と、前記音声ガイダンスのガイダンスシナリオ上の遷移状態および前記テキスト/画像のガイダンスシナリオ上の遷移状態をそれぞれ保持するガイダンス遷移状態保持部と、前記ガイダンス遷移状態保持部により保持される前記遷移状態に従って、前記端末装置に対し、前記音声送受信部により前記音声ガイダンスを、および前記パケット送受信部により前記テキスト/画像を、それぞれ送信制御するガイダンス送信制御部と、前記端末装置から、前記音声送受信部により前記音声ガイダンスに対する応答音声信号を、または、前記パケット送受信部により前記テキスト/画像に対する応答パケットデータを、受信制御する応答受信制御部と、前記応答音声信号および前記応答パケットデータのいずれか一方が受信されると、前記ガイダンス遷移状態保持部により保持され、受信された応答音声信号または応答パケットデータに対応する一方の遷移状態を進行させると共に、他方の遷移状態を、進行させた前記一方の遷移状態と一致させるべく進行させるガイダンス同期制御部と、を具備し、前記パケット通信セッション確立指令部は、前記ガイダンスシナリオ上の前記遷移状態の変化に対応して、前記端末装置に通知される前記パケット通信セッション確立指令を、前記音声通信セッションを介して前記端末装置へプッシュ通知することを特徴とする。
この構成による音声ガイダンスサーバは、端末装置へ対話式で音声ガイダンスを提供可能である。この音声ガイダンスサーバは、音声送受信部と、パケット送受信部と、ガイダンス遷移状態保持部と、応答受信制御部と、ガイダンス同期制御部と、を備えている。音声送受信部は、端末装置との間で音声通信セッションを介して音声信号を送受信する。パケット送受信部は、端末装置との間でパケット通信セッションを介してパケットデータを送受信する。
ガイダンス送信制御部は、ガイダンス遷移状態保持部により保持される遷移状態に従って、端末装置に対し、音声送受信部により音声ガイダンスを送信制御する。同様に、ガイダンス送信制御部は、パケット送受信部によりテキスト/画像を、それぞれ送信制御する。応答受信制御部は、音声ガイダンスに対する端末装置からの応答音声信号を、音声送受信部により受信制御する。同様に、この応答受信制御部は、テキスト/画像に対する端末装置からの応答パケットデータを、パケット送受信部により受信制御する。
ガイダンス遷移状態保持部は、ガイダンスシナリオ上の音声ガイダンスの遷移状態と、ガイダンスシナリオ上のテキスト/画像の遷移状態とを、それぞれ保持することができる。そして、このガイダンス遷移状態保持部は、応答音声信号および応答パケットデータのいずれか一方が受信されると、受信された応答音声信号または応答パケットデータに対応する一方の遷移状態を進行させて保持する。そして、他方の遷移状態を、進行させた一方の遷移状態と一致させるべく進行させる。
したがって、端末装置では、音声ガイダンスと、テキスト/画像とを、一致した遷移状態で受信できる。このように、端末装置において、通話状態で音声ガイダンスを聞きながら、その音声ガイダンスの遷移状態と一致したテキスト/画像を、適宜に表示させることができるので利便性が高められる。
また、この構成による音声ガイダンスサーバは、パケット通信セッション確立判断部と、パケット通信セッション確立指令部と、をさらに備えている。パケット通信セッション確立判断部は、パケット通信セッションをいつ確立させるかを判断する。また、パケット通信セッション確立指令部は、パケット通信セッション確立判断部が、パケット通信セッションを確立させるべきことを判断した時に、パケット通信セッションを確立させるように端末装置に要求する。
したがって、この音声ガイダンスサーバは、音声通信セッションのみによる音声ガイダンスを受けている状態において、必要に応じて、パケット通信セッションによるテキスト/画像で、確実に補完することが可能である。つまり、パケット通信セッション確立判断部の判断により、音声ガイダンスに加えて、パケット通信セッションが確立されるので、ガイダンスシナリオの内容等によっては、きわめて有用である。
さらに、この構成による音声ガイダンスサーバは、音声通信セッションのみが確立された状態で、シナリオ上の遷移状態の進行がある等の変化に対応し、パケット通信セッション確立指令部により送信されるパケット通信セッション確立指令を、音声通信セッションにより端末装置へ通知することができる。このパケット通信セッション確立指令は、音声通信セッションを介して端末装置へプッシュ通知される。したがって、ユーザが音声ガイダンスを受けている状態において、確実にテキスト/画像で補うことができる。
また、本発明の他の態様にかかる音声ガイダンスサーバは、前記ガイダンス同期制御部、前記パケット通信セッション確立指令部により通知された前記パケット通信セッション確立指令に応答して前記端末装置により確立されたパケット通信セッションと、前記予め確立された音声通信セッションとをそれぞれ介した前記テキスト/画像および前記音声ガイダンスの前記ガイダンスシナリオ上の前記遷移状態を同期させることを特徴とする。
まず、端末装置から音声接続が開始され、音声ガイダンスサーバとの間に音声通信セッションのみが確立された状態となる。次に、例えば、シナリオの内容等の状況により、パケット通信セッション確立指令部からの要求に応じて、端末装置から、音声ガイダンスサーバとの間にパケット通信セッションを確立させる。その後、ガイダンス同期制御部が、音声通信セッションにより進行するガイダンスシナリオ上の遷移状態と、パケット通信セッションにより進行すべきガイダンスシナリオ上の遷移状態と、を一致させる。つまり、ガイダンス同期制御部が、音声側と、パケット側と、それぞれのガイダンスの遷移状態を同期させる。
また、本発明の他の態様にかかる音声ガイダンスサーバは、前記パケット通信セッション確立判断部は、前記音声通信セッションを介して前記端末装置に送信された前記音声ガイダンスに応答して、前記端末装置から受信される前記応答音声信号が、所定回数以上、前記ガイダンスシナリオ上の入力誤りと判断される場合には、前記パケット通信セッションを確立すべきと判断することを特徴とする。
この構成によれば、音声通信セッションのみが確立された状態で、音声ガイダンスに応答して、端末装置から受信される応答音声信号が、所定回数以上、ガイダンスシナリオ上の入力誤りと判断される場合、パケット通信セッション確立判断部が、パケット通信セッションを確立すべきと判断する。このように、音声ガイダンスサーバは、音声通信セッションによるガイダンスシナリオ上の入力誤りが生じても、パケット通信セッションにより補うことが可能である。
また、本発明の他の態様にかかる音声ガイダンスサーバは、前記端末装置に対して、前記ガイダンスシナリオ上の前記遷移状態の進行を通知する遷移状態進行通知部をさらに具備することを特徴とする。この構成によれば、シナリオ上の遷移状態の進行を音声ガイダンスサーバから端末装置へ通知することができる。したがって、音声側とパケット側とのシナリオの乖離を防ぐことができる。
また、本発明の他の態様にかかる音声ガイダンスサーバは、前記ガイダンス同期制御部は、前記応答音声信号および前記応答パケットデータのいずれか一方が受信されると、前記ガイダンス遷移状態保持部により保持され、受信された応答音声信号または応答パケットデータに対応する一方の遷移状態を進行させると共に、他方の遷移状態は、前記一方の遷移状態が複数回進行した後に、複数回進行させた前記一方の遷移状態と一致させるべく進行させることを特徴とする。この構成によれば、音声通信セッションとパケット通信セッションとのいずれか一方の通信セッションにより進行したガイダンスシナリオ上の遷移状態が、複数回進行した後に、他方の通信セッションにより進行すべきガイダンスシナリオ上の遷移状態を一致させることができる。
また、本発明の他の態様にかかる音声ガイダンスサーバは、端末装置へ対話式で音声ガイダンスを提供可能な音声ガイダンスサーバであって、前記端末装置との間で音声通信セッションを介して音声ガイダンスを音声信号として送受信する音声送受信部と、前記端末装置と自サーバとの間に、予め確立された音声通信セッションに加えてパケット通信セッションを確立すべきか否かを判断するパケット通信セッション確立判断部と、前記パケット通信セッション確立判断部により前記パケット通信セッションを確立すべきと判断された場合に、前記端末装置から前記パケット通信セッションの確立を要求させるパケット通信セッション確立指令を前記端末装置に通知するパケット通信セッション確立指令部と、前記端末装置との間でパケット通信セッションを介してテキスト/画像をパケットデータとして送受信するパケット送受信部と、前記音声ガイダンスおよび前記テキスト/画像のガイダンスシナリオ上の遷移状態をそれぞれ保持するガイダンス遷移状態保持部と、前記ガイダンス遷移状態保持部により保持される前記遷移状態に従って、前記端末装置に対し、前記音声送受信部により前記音声ガイダンスを、および前記パケット送受信部により前記テキスト/画像を、それぞれ送信制御するガイダンス送信制御部と、前記端末装置から、前記音声送受信部により前記音声ガイダンスに対する応答音声信号を、または、前記パケット送受信部により前記テキスト/画像に対する応答パケットデータを、受信制御する応答受信制御部と、前記応答音声信号および前記応答パケットデータのいずれか一方が受信されると、前記ガイダンス遷移状態保持部により保持され、受信された応答音声信号または応答パケットデータに対応する一方の遷移状態を進行させると共に、他方の遷移状態を、進行させた前記一方の遷移状態と一致させるべく進行させるガイダンス同期制御部と、を具備し、前記ガイダンス同期制御部は、前記パケット通信セッション確立指令部により通知された前記パケット通信セッション確立指令に応答して前記端末装置により確立されたパケット通信セッションと、前記予め確立された音声通信セッションとをそれぞれ介した前記テキスト/画像および前記音声ガイダンスの前記ガイダンスシナリオ上の前記遷移状態を同期させ、前記パケット通信セッション確立判断部は、前記音声通信セッションを介して前記端末装置に送信された前記音声ガイダンスに応答して、前記端末装置から受信される前記応答音声信号が、所定回数以上、前記ガイダンスシナリオ上の入力誤りと判断される場合には、前記パケット通信セッションを確立すべきと判断することを特徴とする。
また、本発明の他の態様にかかる音声ガイダンスサーバは、端末装置へ対話式で音声ガイダンスを提供可能な音声ガイダンスサーバであって、前記端末装置との間で音声通信セッションを介して音声ガイダンスを音声信号として送受信する音声送受信部と、前記端末装置との間でパケット通信セッションを介してテキスト/画像をパケットデータとして送受信するパケット送受信部と、前記音声ガイダンスおよび前記テキスト/画像のガイダンスシナリオ上の遷移状態をそれぞれ保持するガイダンス遷移状態保持部と、前記ガイダンス遷移状態保持部により保持される前記遷移状態に従って、前記端末装置に対し、前記音声送受信部により前記音声ガイダンスを、および前記パケット送受信部により前記テキスト/画像を、それぞれ送信制御するガイダンス送信制御部と、前記端末装置から、前記音声送受信部により前記音声ガイダンスに対する応答音声信号を、または、前記パケット送受信部により前記テキスト/画像に対する応答パケットデータを、受信制御する応答受信制御部と、前記応答音声信号および前記応答パケットデータのいずれか一方が受信されると、前記ガイダンス遷移状態保持部により保持され、受信された応答音声信号または応答パケットデータに対応する一方の遷移状態を進行させると共に、他方の遷移状態を、進行させた前記一方の遷移状態と一致させるべく進行させるガイダンス同期制御部と、前記音声通信セッションが確立される前に、前記パケット送受信部により前記パケット通信セッションを介して前記端末装置から前記端末装置の識別子が受信された場合に、受信された識別子を有する端末装置に対して前記音声送受信部により音声通話発信を行うことにより、前記端末装置への音声通信セッションを確立する音声通信セッション確立部と、を具備し、前記ガイダンス同期制御部は、前記音声通信セッション確立部により前記端末装置に対して確立された音声通信セッションと、前記端末装置に対して予め確立されたパケット通信セッションとをそれぞれ介した前記音声ガイダンスおよび前記テキスト/画像の前記ガイダンスシナリオ上の前記遷移状態を同期させることを特徴とする。
この構成によれば、パケット通信セッションのみにより、テキスト/画像を受けている状態で、必要に応じて、端末装置からパケット通信セッションにより、その端末装置の電話番号等、識別子の通知を受けた後に、音声ガイダンスサーバから端末装置へ発呼可能であり、そこから音声ガイダンスの遷移状態と一致したテキスト/画像を、適宜に表示させられる。
また、本発明の他の態様にかかる音声ガイダンスサーバは、端末装置へ対話式で音声ガイダンスを提供可能な音声ガイダンスサーバであって、前記端末装置との間で音声通信セッションを介して音声ガイダンスを音声信号として送受信する音声送受信部と、前記端末装置との間でパケット通信セッションを介してテキスト/画像をパケットデータとして送受信するパケット送受信部と、前記音声ガイダンスおよび前記テキスト/画像のガイダンスシナリオ上の遷移状態をそれぞれ保持するガイダンス遷移状態保持部と、前記ガイダンス遷移状態保持部により保持される前記遷移状態に従って、前記端末装置に対し、前記音声送受信部により前記音声ガイダンスを、および前記パケット送受信部により前記テキスト/画像を、それぞれ送信制御するガイダンス送信制御部と、前記端末装置から、前記音声送受信部により前記音声ガイダンスに対する応答音声信号を、または、前記パケット送受信部により前記テキスト/画像に対する応答パケットデータを、受信制御する応答受信制御部と、前記応答音声信号および前記応答パケットデータのいずれか一方が受信されると、前記ガイダンス遷移状態保持部により保持され、受信された応答音声信号または応答パケットデータに対応する一方の遷移状態を進行させると共に、他方の遷移状態を、進行させた前記一方の遷移状態と一致させるべく進行させるガイダンス同期制御部と、前記端末装置に対して、前記ガイダンスシナリオ上の前記遷移状態の進行を通知する遷移状態進行通知部と、を具備することを特徴とする。
また、本発明の他の態様にかかる音声ガイダンスサーバは、端末装置へ対話式で音声ガイダンスを提供可能な音声ガイダンスサーバであって、前記端末装置との間で音声通信セッションを介して音声ガイダンスを音声信号として送受信する音声送受信部と、前記端末装置との間でパケット通信セッションを介してテキスト/画像をパケットデータとして送受信するパケット送受信部と、前記音声ガイダンスおよび前記テキスト/画像のガイダンスシナリオ上の遷移状態をそれぞれ保持するガイダンス遷移状態保持部と、前記ガイダンス遷移状態保持部により保持される前記遷移状態に従って、前記端末装置に対し、前記音声送受信部により前記音声ガイダンスを、および前記パケット送受信部により前記テキスト/画像を、それぞれ送信制御するガイダンス送信制御部と、前記端末装置から、前記音声送受信部により前記音声ガイダンスに対する応答音声信号を、または、前記パケット送受信部により前記テキスト/画像に対する応答パケットデータを、受信制御する応答受信制御部と、前記応答音声信号および前記応答パケットデータのいずれか一方が受信されると、前記ガイダンス遷移状態保持部により保持され、受信された応答音声信号または応答パケットデータに対応する一方の遷移状態を進行させると共に、他方の遷移状態を、進行させた前記一方の遷移状態と一致させるべく進行させるガイダンス同期制御部と、を具備し、前記ガイダンス同期制御部は、前記応答音声信号および前記応答パケットデータのいずれか一方が受信されると、前記ガイダンス遷移状態保持部により保持され、受信された応答音声信号または応答パケットデータに対応する一方の遷移状態を進行させると共に、他方の遷移状態は、前記一方の遷移状態が複数回進行した後に、複数回進行させた前記一方の遷移状態と一致させるべく進行させることを特徴とする。
また、本発明の他の態様にかかる音声ガイダンス方法は、端末装置へ対話式で音声ガイダンスを提供可能とする音声ガイダンスサーバを用いた音声ガイダンス方法であって、前記音声ガイダンスサーバは、前記端末装置との間で音声通信セッションを介して音声ガイダンス音声信号として送受信する音声送受信部と、前記端末装置と自サーバとの間に、予め確立された音声通信セッションに加えてパケット通信セッションを確立すべきか否かを判断するパケット通信セッション確立判断部と、前記パケット通信セッション確立判断部により前記パケット通信セッションを確立すべきと判断された場合に、前記端末装置から前記パケット通信セッションの確立を要求させるパケット通信セッション確立指令を前記端末装置に通知するパケット通信セッション確立指令部と、前記端末装置との間で確立されたパケット通信セッションを介してテキスト/画像をパケットデータとして送受信するパケット送受信部と、前記音声ガイダンスのガイダンスシナリオ上の遷移状態および前記テキスト/画像のガイダンスシナリオ上の遷移状態をそれぞれ保持するガイダンス遷移状態保持部と、を具備すると共に、前記音声送受信部が、前記端末装置との間で前記音声通信セッションを介して前記音声信号を送受信する音声送受信ステップと、前記パケット通信セッション確立判断部が、前記端末装置と自サーバとの間に、予め確立された音声通信セッションに加えてパケット通信セッションを確立すべきか否かを判断するパケット通信セッション確立判断ステップと、前記パケット通信セッション確立指令部が、前記パケット通信セッション確立判断ステップにおいて前記パケット通信セッションを確立すべきと判断された場合に、前記端末装置から前記パケット通信セッションの確立を要求させるパケット通信セッション確立指令を前記端末装置に通知するパケット通信セッション確立指令ステップと、前記パケット送受信部が、前記端末装置との間で確立されたパケット通信セッションを介してパケットデータを送受信するパケット送受信ステップと、前記音声ガイダンスのガイダンスシナリオ上の遷移状態および前記テキスト/画像のガイダンスシナリオ上の遷移状態をそれぞれ保持するガイダンス遷移状態保持ステップと、前記ガイダンス遷移状態保持ステップにより保持される前記遷移状態に従って、前記端末装置に対し、前記音声送受信部により前記音声ガイダンスを、および前記パケット送受信部により前記テキスト/画像を、それぞれ送信制御するガイダンス送信制御ステップと、前記端末装置から、前記音声送受信部により前記音声ガイダンスに対する応答音声信号を、または、前記パケット送受信部により前記テキスト/画像に対する応答パケットデータを、受信制御する応答受信制御ステップと、前記応答音声信号および前記応答パケットデータのいずれか一方が受信されると、前記ガイダンス遷移状態保持ステップにより保持され、受信された応答音声信号または応答パケットデータに対応する一方の遷移状態を進行させると共に、他方の遷移状態を、進行させた前記一方の遷移状態と一致させるべく進行させるガイダンス同期制御ステップと、を含み、前記パケット通信セッション確立指令ステップにおいて、前記ガイダンスシナリオ上の前記遷移状態の変化に対応して、前記端末装置に通知される前記パケット通信セッション確立指令を、前記音声通信セッションを介して前記端末装置へプッシュ通知することを特徴とする。
この方法によれば、端末装置において、通話状態で受ける音声ガイダンスを聞きながら、その音声ガイダンスの遷移状態と一致したテキスト/画像を、適宜に表示させられるので利便性が高められる。
また、本発明の他の態様にかかる音声ガイダンスプログラムは、音声ガイダンスサーバとして機能するコンピュータを、端末装置へ対話式で音声ガイダンスを提供可能に動作させる音声ガイダンスプログラムであって、前記端末装置との間で音声通信セッションを介して音声信号を送受信する音声送受信処理と、前記端末装置と自サーバとの間に、予め確立された音声通信セッションに加えてパケット通信セッションを確立すべきか否かを判断するパケット通信セッション確立判断処理と、前記パケット通信セッション確立判断処理において前記パケット通信セッションを確立すべきと判断された場合に、前記端末装置から前記パケット通信セッションの確立を要求させるパケット通信セッション確立指令を前記端末装置に通知するパケット通信セッション確立指令処理と、前記端末装置との間で確立されたパケット通信セッションを介してパケットデータを送受信するパケット送受信処理と、前記音声ガイダンスのガイダンスシナリオ上の遷移状態およびテキスト/画像のガイダンスシナリオ上の遷移状態をそれぞれ保持するガイダンス遷移状態保持処理と、前記ガイダンス遷移状態保持処理により保持される前記遷移状態に従って、前記端末装置に対し、前記音声送受信処理により前記音声ガイダンスを、および前記パケット送受信処理により前記テキスト/画像を、それぞれ送信制御するガイダンス送信制御処理と、前記端末装置から、前記音声送受信処理により前記音声ガイダンスに対する応答音声信号を、または、前記パケット送受信処理により前記テキスト/画像に対する応答パケットデータを、受信制御する応答受信制御処理と、前記応答音声信号および前記応答パケットデータのいずれか一方が受信されると、前記ガイダンス遷移状態保持処理により保持され、受信された応答音声信号または応答パケットデータに対応する一方の遷移状態を進行させると共に、他方の遷移状態を、進行させた前記一方の遷移状態と一致させるべく進行させるガイダンス同期制御処理と、を含み、前記パケット通信セッション確立指令処理において、前記ガイダンスシナリオ上の前記遷移状態の変化に対応して、前記端末装置に通知される前記パケット通信セッション確立指令を、前記音声通信セッションを介して前記端末装置へプッシュ通知することを特徴とする音声ガイダンスプログラム。
このプログラムによれば、端末装置において、通話状態で受ける音声ガイダンスを聞きながら、その音声ガイダンスの遷移状態と一致したテキスト/画像を、適宜に表示させられるので利便性が高められる。
また、本発明の他の態様にかかる音声ガイダンスシステムは、端末装置と、前記端末装置へ対話式で音声ガイダンスを提供可能な音声ガイダンスサーバと、前記端末装置と前記音声ガイダンスサーバとの間を音声通信接続する音声ネットワークと、前記端末装置と前記音声ガイダンスサーバとの間をパケット通信接続するパケットネットワークと、を備えた音声ガイダンスシステムであって、前記音声ガイダンスサーバは、前記端末装置との間で音声通信セッションを介して音声信号を送受信する音声送受信部と、前記端末装置と自サーバとの間に、予め確立された音声通信セッションに加えてパケット通信セッションを確立すべきか否かを判断するパケット通信セッション確立判断部と、前記パケット通信セッション確立判断部により前記パケット通信セッションを確立すべきと判断された場合に、前記端末装置から前記パケット通信セッションの確立を要求させるパケット通信セッション確立指令を前記端末装置に通知するパケット通信セッション確立指令部と、前記端末装置との間で確立されたパケット通信セッションを介してパケットデータを送受信するパケット送受信部と、前記音声ガイダンスのガイダンスシナリオ上の遷移状態およびテキスト/画像のガイダンスシナリオ上の遷移状態をそれぞれ保持するガイダンス遷移状態保持部と、前記ガイダンス遷移状態保持部により保持される前記遷移状態に従って、前記端末装置に対し、前記音声送受信部により前記音声ガイダンスを、および前記パケット送受信部により前記テキスト/画像を、それぞれ送信制御するガイダンス送信制御部と、前記端末装置から、前記音声送受信部により前記音声ガイダンスに対する応答音声信号を、または、前記パケット送受信部により前記テキスト/画像に対する応答パケットデータを、受信制御する応答受信制御部と、前記応答音声信号および前記応答パケットデータのいずれか一方が受信されると、前記ガイダンス遷移状態保持部により保持され、受信された応答音声信号または応答パケットデータに対応する一方の遷移状態を進行させると共に、他方の遷移状態を、進行させた前記一方の遷移状態と一致させるべく進行させるガイダンス同期制御部と、を具備し、前記パケット通信セッション確立指令部は、前記ガイダンスシナリオ上の前記遷移状態の変化に対応して、前記端末装置に通知される前記パケット通信セッション確立指令を、前記音声通信セッションを介して前記端末装置へプッシュ通知することを特徴とする。
このシステムによれば、端末装置において、通話状態で受ける音声ガイダンスを聞きながら、その音声ガイダンスの遷移状態と一致したテキスト/画像を、適宜に表示させられるので利便性が高められる。
本発明によれば、端末装置において、通話状態で受ける音声ガイダンスを聞きながら、その音声ガイダンスの遷移状態と一致したテキスト/画像を、適宜に表示させられ、対話型音声ガイダンスにおいて、ユーザの対応に誤りを招来するという問題を解決することが出来る。
本実施形態における音声ガイダンスシステムの概略説明図である。 本実施形態における音声ガイダンスサーバの概略ブロック図である。 本実施形態における音声ガイダンスシステムで同期確立するシーケンス図である。 本実施形態における音声ガイダンスシステムにより、音声側で操作し、画面が追従するパタンのシーケンス図である。 本実施形態における音声ガイダンスシステムにより、画面側で操作し、音声ガイダンスが追従するパタンのシーケンス図である。 本実施形態における音声ガイダンスシステムによる、音声とパケットと同期確立するまでの接続手順のパタンP1、音声・パケットともに端末装置からの発信である場合の説明図である。 本実施形態における音声ガイダンスシステムによる、音声とパケットと同期確立するまでの接続手順のパタンP2として、端末装置からサーバに音声接続後、さらに端末装置からパケットの接続要求する場合の説明図である。 本実施形態における音声ガイダンスシステムによる、音声とパケットと同期確立するまでの接続手順のパタンP3、パケットで事前準備を行った後で、サーバから発呼する場合の説明図である。 本実施形態における音声ガイダンスシステムを留守番電話に適用した場合の動作を示すフローチャートである。 本実施形態における音声ガイダンスシステムをユーザ認証に適用した場合の動作を示すフローチャートである。 本実施形態における音声ガイダンス方法および音声ガイダンスプログラムの要点のみを示すフローチャートである。 本実施形態における音声ガイダンスシステムにより、音声通信側とパケット通信側のいずれか一方からの入力により、両方のガイダンスの遷移状態を同期させるシーケンス図である。
以下、本発明における実施形態を、図面を参照して説明する。なお、以下の説明において参照する各図では、他の図と同等部分は同一符号によって示されている。以下は、本実施形態による音声ガイダンスシステムを、移動通信網による音声ネットワークおよびWeb通信可能なパケットネットワークに設けた場合について説明する。
また、実際の移動通信網には、無線基地局装置、無線制御装置等の装置が設けられているが、説明を簡単にするため、それらの装置は図示せず、かつ説明を省略する。また、以下の説明において登場する端末装置は、スマートフォンを含み、電話番号が定められており、音声送受信部とパケット送受信部とを備えた装置であって、音声通話中にも、パケット送受信部およびブラウザを用いて、画像または文字を表示できる端末装置を想定している。なお、端末装置は移動通信端末に限定するものではない。
また、DTMF(Dual Tone Multi-Frequency)プッシュ方式の電話機は、プッシュボタンを押すたびに発信されるトーン信号と呼ばれるPB(プッシュボタン)音により、16種類の信号を表現することができる。このDTMFプッシュ方式の電話機は、1つのボタンを押すと2種類の高さの音が発信されるようになっており、交換局はこの信号音に基づいて発信元の電話番号を検出することができる。高音系4種類と低音系4種類からそれぞれ1音ずつを組み合わせるため、「0」から「9」までの数字、「*」「#」、「A」から「D」までのアルファベットの、合わせて16種類を表現することができる。ユーザは、端末装置50の操作により、このPB音を出力し、後述する音声ガイダンスサーバに、自分の意思を伝えることができる。
(音声ガイダンスシステムの概要)
本実施形態における、音声ガイダンスシステムの概要について、図1を参照して説明する。図1は、実施形態における音声ガイダンスシステムの概略説明図である。図1に示す音声ガイダンスシステム(以下、本システムという)100は、音声ガイダンスサーバ60と、その音声ガイダンスサーバ60に対して、音声およびパケットの両経路による通信を同時に行うことが可能な端末装置50と、その端末装置50から音声ガイダンスサーバ60までの間に介在する音声ネットワーク(以下、音声NWと略す)70と、端末装置50から音声ガイダンスサーバ60までの間に介在するパケットネットワーク(以下、パケットNWと略す)80と、より構成されている。端末装置50は、情報ネットワークから画像情報を閲覧するためのブラウザ利用と、音声対話とを、1台で同時に利用可能な移動通信端末であり、本実施形態においては、一例としてスマートフォンを用いて説明する。
図1に示す音声ガイダンスサーバ60は、音声ガイダンスサーバ60は、音声ガイダンスの音声情報(以下、ガイダンス音源、または単に音源という)4と、テキスト/画像情報5と、対話型シナリオ(ガイダンス&Web)30と、音声制御インターフェース(以下、音声制御IFと略す)10と、Web制御インターフェース(以下、Web制御IFと略す)20と、より構成されている。対話型シナリオ30は、ユーザの利用目的に沿って次の操作を案内(以下、ガイダンスという)する機能と、Web(WWW;World Wide Web)対応機能と、を有するコンピュータ等で主要構成されている。
なお、音声ガイダンスサーバ60と、それに含まれる対話型シナリオ30および、その他の機能部のほとんどは、相当のプログラムを実行するコンピュータにより実現される。ただし、このコンピュータは、一体である必要はなく、分散して構成されていても構わない。また、WWWを参照するにはWebブラウザ等のソフトウェアを使用する。音声ガイダンスサーバ60側のWebブラウザは、端末装置50からの情報を音声ガイダンスサーバ60内に取り込んで処理することにより、何らかの相互作用をもたらすことができる。また、端末装置50側のWebブラウザは、Webページ等のテキスト/画像情報を、WWWサーバから取得し、モニター等の出力デバイスに表示する。音声ガイダンスサーバ60はWWWサーバの一つである。
以下に、本システム100の概略動作を説明する。音声ガイダンスサーバ60が、その音声制御IF10により、音声NW70を介して端末装置50と接続されている状態で、端末装置50から送信されたPB音が、音声NW70を介して音声ガイダンスサーバ60に受信される(ステップS1)。このPB音を受信した音声ガイダンスサーバ60は、音声NW70を介して端末装置50へ音声ガイダンスを送信する(ステップS10)。
一方、端末装置50により入力されたデータ入力信号が、パケットNW80を介して、Web制御IF20で受信される(ステップS3)。それに対応して、音声ガイダンスサーバ60は、パケットNW80を介して、テキスト/画像を端末装置50へ送信する(ステップS10)。
ここで、端末装置50は、以下を実行する。
(1)音声ガイダンスサーバ60から送信された音声を出力する。
(2)ユーザのPB入力を、音声ガイダンスサーバ60に音声信号として送信する。
(3)音声ガイダンスサーバ60から送信されたテキスト/画像を画面に表示する。
(4)ユーザの入力したデータを音声ガイダンスサーバ60にデータ入力信号として送信する。
また、音声制御IF10は、以下を実行する。
(1)対話側シナリオ30の指示に従い、端末装置50に対して音声ガイダンスを送信する。
(2)端末装置50からのPB信号を対話型シナリオ30へ伝達する。
また、Web制御IF20は、以下を実行する。
(1)対話側シナリオ30の指示に従い、端末装置50に対してテキスト/画像を送信する。
(2)端末装置50からのデータ入力信号を対話型シナリオ30に伝達する。
また、対話側シナリオ30は、音声制御IF10と、Web制御IF20と、少なくともいずれかの入力に対応して、次の指示を与えるように応答する。
図2は本実施形態における音声ガイダンスサーバの概略ブロック図である。図2に示す音声ガイダンスサーバ60は、図1を用いて既に概略構成を説明したが、音声制御IF10と、Web制御IF20と、対話型シナリオ30とを、それぞれ詳しく説明する。
対話型シナリオ30は、ガイダンスシナリオ31と、Webアプリケーション(Webapplication:以下、WebAPLともいう)32と、音声ユーザID/WebユーザID対応付け部33と、ガイダンス同期制御部34と、ガイダンス遷移状態保持部35と、を備えている。ガイダンスシナリオ31は、ユーザに対話型シナリオサービスを提供するためのシナリオを構成するプログラムである。すなわち、端末装置50からのPB音、または、PB音に相当する音声等による操作を音声ガイダンスサーバ60が受け付けて応答する要領を規定したプログラムである。具体的には、ユーザが音声ガイダンスサーバ60を相手に対話形式でコミュニケーションを進行できるようにするための音声ガイダンスと、テキスト/画像と、それらを送信して応答を受信するための適切な順番およびタイミングと、を設定したプログラムである。このガイダンスシナリオ31により、音声ガイダンスサーバ60は、ユーザ向けにガイダンスを送信するほか、ユーザからの音声等にも応答し、対話型のコミュニケーションを進めながら、ユーザの目的を達成し易く支援するインタラクティブなサービスを実現する。
音声制御IF10は、ユーザID導出部(ユーザID認証部ともいう)11と、ガイダンス送出/PB認識部12と、を含んでいる。ユーザID認証部11は、音声通信側でのユーザ認証を行う。例えば、ID/PASSWORDの入力や回線認証等により、ユーザ認証を行う。ユーザID認証部11は、認証結果を対話型シナリオ30に伝達する。ガイダンス送出/PB認識部12は、端末装置50から送信されたPB信号を認識する機能と、ガイダンス音源を送出する機能とを含んでいる。
また、Web制御IF20は、ユーザID導出部(ユーザID認証部ともいう)21と、Web/シナリオ同期部22と、を含んでいる。ユーザID認証部21は、パケット通信側でのユーザ認証を行う。ここでも、ユーザID認証部11と同様に、ID/PASSWORDの入力や回線認証等により、ユーザ認証を行う。このユーザID認証部21も、認証結果を対話型シナリオ30に伝達する。Web/シナリオ同期部22は、音声通信側でガイダンスシナリオ31上の遷移状態(以下、ガイダンス遷移状態ともいう)が進行した場合、端末装置50の端末APLに対してプッシュを行う。このことは、後述する図4のステップS201〜S208により詳しく説明する。また、プッシュ手段として、例えば図7に沿って後述するSMSプッシュ等が好ましい。
一方、端末装置50には、図2の右下に示すように、音声ガイダンスサーバ60との同期を確保するサーバプッシュ同期部9が含まれていることが好ましい。つまり、端末装置50から、音声ガイダンスサーバ60へ、コミュニケーションの進捗状況が、ガイダンスシナリオ31上のどの段階まで進んでいるのか、すなわちガイダンス遷移状態を、何かしらの手段でサーバから取得する必要がある。そこで、端末装置50のサーバプッシュ同期部9が、定期的にサーバに対して問い合わせる、あるいはサーバからの何かしらのPush信号を契機に問い合わせ処理を起動する(図4のステップS209)ことにより、端末装置50と、音声ガイダンスサーバ60との間で、リアルタイムに状態を同期する。
なお、ステップS209で、端末装置50が、定期問い合わせ処理を起動することを、定期ポーリング(Polling)等による擬似プッシュともいう。また、ガイダンス遷移状態が進行した場合とは、ユーザの目的が、音声ガイダンスサーバ60に対するコミュニケーションにより達成されるまでに、ガイダンスシナリオに設定された複数の段階に沿って、コミュニケーションが進行した状態を意味する。例えば、チケットを購入する目的において、購入対象を指定し終わった段階等を意味する。なお、Web/シナリオ同期部22は、ユーザが端末装置50から送信したデータ入力信号を対話型シナリオ30に伝達する機能も有する。
WebAPL32は、音声ガイダンスサーバ60にアクセスする端末装置50に対して、必要なデータの処理や転送を指示する。なお、WebAPLとは、Webの機能や特徴を利用したサーバ上にあるアプリケーションソフトウェアのことである。音声ユーザID/WebユーザID対応付け部33は、音声制御IF10で使っているユーザIDと、パケット制御IF20で使っているユーザIDとを対応付ける。なお、対応付けができない場合には専用の対応付けシナリオを起動する。ガイダンス遷移状態保持部35は、音声通信側とパケット通信側それぞれの遷移状態情報を更新して保持する。ガイダンス同期制御部34は、ガイダンス遷移状態保持部35に保持された遷移状態情報を用いて、音声ガイダンスの遷移状態とテキスト/画像の遷移状態とを同期させる。
ガイダンス遷移状態保持部35は、音声通信セッションによるPB信号またはパケット通信セッションによるデータ入力信号の少なくとも一方が受信され、その受信された方の信号に基づいてガイダンスの遷移状態が進む都度に、受信されていない方の信号に基づいてガイダンスの遷移状態も一致して進めるように更新された遷移状態情報を記憶する。このことは、図4のステップS202〜S212および図5のステップS301〜S304に示して後述する。また、ガイダンス同期制御部34は、ガイダンス遷移状態保持部35は、に保持された遷移状態情報を用いて、音声通信セッションのガイダンス遷移状態と、パケット通信セッションのガイダンス遷移状態と、を対応付けるように制御する。その結果、音声ガイダンスサーバ60は、音声ガイダンスとテキスト/画像とを同期させることができる。
図3は、本実施形態における音声ガイダンスシステムで同期確立するシーケンス図である。図3に示すように、本システム100は、音声ガイダンスサーバ60と、端末装置50との双方向通信により、ユーザが通信する目的の達成を支援する。まず、端末装置50から音声ガイダンスサーバ60へ音声を発信する(ステップS101)。ステップS101による音声発信を受信した音声ガイダンスサーバ60は、その内部に備わる音声制御IF10により、ユーザ認証する(ステップS102)。具体的な認証方法としては、発信者番号通知のほか、電話回線の契約時等事前に登録されたID/PASSWORDからMSISDN(Mobile Subscriber Integrated Services Digital Network Number)を導出する方法等が考えられる。そして、ステップS102で、音声制御IF10によりユーザ認証されると、接続可否について確認した結果を、対話型シナリオ30へ通知する(ステップS103)。なお、ユーザ認証を省略して、ステップS101による音声発信を受信した音声ガイダンスサーバ60は、全て接続するようにしても構わない。
ステップS103により、端末装置50が、音声ガイダンスサーバ60に接続できることの確認が得られると、対話型シナリオ30およびガイダンス遷移状態保持部35により、同期/シナリオ確認が行われる(ステップS104)。このステップS104では、音声通信のユーザIDとパケット通信のユーザIDとを対応付けることにより、両方の通信内容を同期させるための準備をする。そして、ステップS105以降で、ガイダンスシナリオ31に基づいて通信内容を決定する。つまり、ユーザの目的にかなう自然なコミュニケーションができるように、対話型シナリオ30において、音声ガイダンスと、テキスト/画像と、それぞれが送信されるタイミングが適切になるように、ガイダンスシナリオ31に基づいて進捗管理を行う。通常は、ガイダンスシナリオ31は、ユーザの目的にかなうサービスが開始されることを示唆して始まるようにプログラムされている。例えば、図9に沿って後述するように、留守番電話であることを明らかにするため、ステップS401において、「(ピーという)発信音のあとにメッセージを録音してください。…」との音声ガイダンスが、音声ガイダンスサーバ60から端末装置50へ送信されるように、ガイダンスシナリオ31がプログラムされている。
ここで、ステップS105により、対話型シナリオ(コンピュータ)30が、ガイダンスシナリオ(プログラム)31を起動する(ステップS105)。このとき、既にステップS103による接続可否の確認結果が接続OKであったため、音声通話可能となる。そして、対話型シナリオ30から音声制御IF10に接続時の音源指示を与える(ステップS106)。ステップS106で与えられた接続時の音源指示、すなわち接続応答は、音声制御IF10から端末装置50へ音声信号により送信される(ステップS107)。ステップS107における接続応答は、パケット通信セッションでなく、音声通信セッションにより端末装置50へ送信される。この時、音声通信セッションは、パケット通信セッション程の遅延が生じないので、ユーザの音声発信(ステップS101)から接続応答(ステップS107)までに生じる遅延時間も少ない。したがって、ユーザに自然な対話を感じさせることができる。
ステップS107における接続応答は、音声ガイダンスへと続く(ステップS108)。ステップS108の音声ガイダンスは、http Request、すなわち、Web接続の要求が含まれており、端末装置50において、通話維持しながらWeb接続する(ステップS109)。ステップS109のWeb接続要求は、Web制御IF20へ送信され、ユーザ認証される(ステップS110)。具体的な認証方法としては、回線認証から一意の電話番号MSISDNを導出する方法を用いる。この認証方法のほか、不図示のテーブルを参照することにより、ID/PASSWORDからMSISDNを導出する方法等も好ましい。そして、ステップS110で、音声制御IF10によりユーザ認証されると、対話型シナリオ30へ接続可否確認の結果を通知する(ステップS111)。なお、回線認証とは、「このユーザは確かにこの(回線/SIMカード)から通信してきた」ということを確認するためのユーザ認証技術である。
ステップS111により、端末装置50が音声ガイダンスサーバ60に接続できることの確認が得られると、対話型シナリオ30およびガイダンス遷移状態保持部35により、同期/シナリオ確認が行われる(ステップS112)。つまり、対話型シナリオ30において、ユーザの目的にかなう自然なコミュニケーションが進行できるように、ガイダンスの進捗管理を行う。そのために、対話型シナリオ30というコンピュータは、ユーザの目的にかなうサービスを進展させるようにガイダンスシナリオ31というプログラムを実行する。
ここで、対話型シナリオ30が、そのガイダンスシナリオ31に基づいて、コミュニケーションの進捗を同期させるように制御する(ステップS112)。すなわち、ステップS111により、端末装置50が、音声ガイダンスサーバ60に接続できることの確認が得られると、対話型シナリオ30およびガイダンス遷移状態保持部35により、同期/シナリオ確認が行われる(ステップS112)。このステップS112では、音声通信のユーザIDとパケット通信のユーザIDとを対応付けることにより、両方の通信内容を同期させるための準備をする。さらに、ステップS112により、同期/シナリオ確認し、同期させるための準備ができたら、音声ガイダンスの進捗とテキストガイダンスの進捗とを同期確立する(ステップS113)。このステップS113で、同期確立したことにより、対話型シナリオ30が、そのガイダンスシナリオ31に基づく遷移状態を進めて更新する。なお、ステップS104,S112でいう同期/シナリオ確認とは、ガイダンスシナリオ31上のどの段階に位置するか、ガイダンスの遷移状態を確認することであり、ステップS104では音声接続された時点との確認、ステップS112ではhttp Requestに応じてWeb接続された時点との確認を意味する。
ここで、対話型シナリオ30が、そのガイダンスシナリオ31に基づいてシナリオ応答する(ステップS114)。このとき、既にステップS111による接続可否の確認結果が接続OKであったため、パケット通信が可能となる。そして、対話型シナリオ30からWeb制御IF20に接続時の画面指示を与える(ステップS115)。ステップS115により指示された画面が、音声ガイダンスサーバ60から端末装置50に返す応答(http response)として、端末装置50で閲覧可能になる(ステップS116)。ステップS116における画面応答は、ステップS112により同期/シナリオ確認され、かつ、S113により同期確立(更新)されているので、音声通信側のシナリオ進捗と同期している。ここで、ユーザが端末装置50を閲覧操作することにより、ガイダンスシナリオ31に基づくテキスト/画像が表示される(ステップS117)。このようにして、音声側とパケット側との両面からユーザに自然な対話を感じさせることができる。
図4は本実施形態における音声ガイダンスシステムにより、音声側で操作し、画面が追従するパタンのシーケンス図である。図4でシーケンス図を示す音声ガイダンスシステム100の構成は、図1と図2とを用いて詳しく説明したとおりである。ただし、図4に示す音声ガイダンスサーバ60は、シーケンスを明確にするために必要な4つの構成要素のみを明示し、その他の構成要素について図4から省略している。
まず、音声通信セッションによる音声ガイダンスと、パケット通信セッションによるテキスト/画像と、同期状態である段階(ステップS200)以降について説明する。端末装置50から音声制御IF10へPB音=Xによる要求信号を送信する(ステップS201)。ステップS201で、音声制御IF10が受信したPB音=Xによる要求信号は、対話型シナリオ30へ伝達される(ステップS202)。ステップS202で、音声制御IF10から対話型シナリオ30へ伝達されたPB音=Xの信号は、対話型シナリオ30にガイダンス遷移状態を進めるように処理(以下、シナリオ処理ともいう)を促す(ステップS203)。
ステップS203で、ガイダンス遷移状態の更新処理(以下、シナリオ更新ともいう)を促された対話型シナリオ30は、ガイダンス遷移状態保持部35に蓄積された遷移状態情報を参照しながらシナリオ更新すると共に、次の指示を与えるように応答する(ステップS204)。ステップS204で、シナリオ更新した対話型シナリオ30は、さらにガイダンス遷移状態保持部35の遷移状態情報を参照しながらガイダンス音源を、音声制御IF10へ指示する(ステップS205)。ステップS205で、音声制御IF10へ指示されたガイダンス音源に基づいて、音声制御IF10から端末装置50へ音声ガイダンスを送信する(ステップS206)。
ここで、Web制御IF20にサーバからのプッシュ機能が具備されている場合は、Web制御IF20から端末装置50の端末APLへプッシュをする(ステップS208)。このプッシュとは、Web制御IF20から端末装置50へ状態更新があったことを通知するための信号を送信することである。ステップS204で、シナリオ更新した対話型シナリオ30は、ステップS205で、音声制御IF10へガイダンス音源を指示すると共に、Web制御IF20へは、シナリオを更新した旨を通知する(ステップS207)。
ステップS207で、シナリオ更新通知を受けたWeb制御IF20は、端末装置50の端末APLへプッシュする(ステップS208)。ステップS208で、Web制御IF20からプッシュ信号を受信した端末装置50は、Web制御IF20へ、http requestにより、最新画面を取得するための要求信号を送信する(ステップS210)。ステップS210で、端末装置50からWeb制御IF20へ送信されたhttp requestは、対話型シナリオ30へ入力される(ステップS211)。ステップS211で、http requestを受けた対話型シナリオ30は、ガイダンス遷移状態保持部35に保持された遷移状態を参照して、最新シナリオを取得する(ステップS212)。
ステップS212で、対話型シナリオ30が取得した最新シナリオは、Web制御IF20へ入力される(ステップS213)。ステップS213で、Web制御IF20へ入力された最新シナリオによるテキスト/画像は、端末装置50へ送信される(ステップS214)。ステップS214で、Web制御IF20から端末装置50へ送信された最新のテキスト/画像は、端末装置50に画面表示される(ステップS215)。このように、ステップS215で、端末装置50に画面表示された内容は、ステップS201で、端末装置50から送信されたPB音=Xによる要求信号に対応している。したがって、端末装置50を用いるユーザにとって、パケット通信セッションによるコミュニケーションの進捗と、音声通信セッションによるコミュニケーションの進捗と、同期した実感が得られる。
ここで、Web制御IF20に端末APLへのプッシュ機能がない場合は、音声ガイダンスサーバ60から端末装置50が最新情報を自動的に受信することはできない。したがって、このプッシュなしに、音声ガイダンスサーバ60から端末装置50が最新情報を受け取るためには、端末装置50が、積極的に音声ガイダンスサーバ60へ問合せをする必要がある。そこで、端末装置50において、定期的に問い合わせ処理を起動することにより(ステップS209)、端末装置50から、音声ガイダンスサーバ60との間の状態同期が、定期問合せの間隔で行われる。
なお、ステップS208で、端末装置50が、定期問い合わせ処理を起動したのち、当該問い合わせに対する応答をサーバ側で保持し、状態が更新されたタイミングで応答することを、ロングポーリング等による擬似プッシュともいう。このロングポーリング等による擬似プッシュについては、図2の右下に示したサーバプッシュ同期部9が行う手段のひとつである。なお、端末APLの一例としては、電子掲示板、銀行のインターネットバンキング、証券会社のオンライントレード、電子商店街等ネット販売のショッピングカート等を挙げることができる。端末装置50がスマートフォンならば、端末APLを適宜ダウンロードして用いることが可能である。その端末装置50にダウンロードされた端末APLによって、サーバプッシュ同期部9が形成されていることが好ましい。
ステップS209で、端末装置50から、音声ガイダンスサーバ60へ、定期的な問合せが継続されると、その定期的な問合せの期間内に、ステップS204で、対話型シナリオ30がシナリオ更新したことを、端末装置50で検出することができる。ステップS209で、端末装置50が、対話型シナリオ30のシナリオ更新(ステップS204)を検出したならば、上述したステップS210〜S215を続けて実行する。すなわち、端末装置50から音声ガイダンスサーバ60へ、最新画面を取得するための要求信号を送信(ステップS210)したことに応じて、音声ガイダンスサーバ60から端末装置50へ送信された最新シナリオによるテキスト/画像が、端末装置50において画面表示される(ステップS215)。
図5は、本実施形態における音声ガイダンスシステムにより、画面側で操作し、音声ガイダンスが追従するパタンのシーケンス図である。図5に示す音声ガイダンスシステム100は、図1と図2とを用いて詳しく説明したとおりである。ただし、音声ガイダンスサーバ60の構成要素について、シーケンスを明確にするために必要な4つだけを、図5では簡略に明示し、その他の構成要素について図5から省略している。図5に示す音声ガイダンスシステム100は、まず、音声通信セッションによる音声ガイダンスと、パケット通信セッションによるテキスト/画像と、同期状態である段階(ステップS300)以降について説明する。このステップS300に示す同期状態において、端末装置50からWeb制御IF20へ、入力結果=Xで示される要求信号を送信する(ステップS301)。
ステップS301により、Web制御IF20で受信された、入力結果=Xという要求信号は、Web制御IF20から対話型シナリオ30へ伝達される(ステップS302)。ステップS302により入力された、入力結果=Xという要求信号に基づいて、対話型シナリオ30は、シナリオ処理を実行する(ステップS303)。その結果、シナリオ更新される(ステップS304)。ステップS304でのシナリオ更新により、ガイダンス遷移状態保持部35は、遷移状態情報も更新して保持する。また、ステップS304において、対話型シナリオ30は、ガイダンス遷移状態保持部35に更新して保持された遷移状態情報に基づいて決定される次の指示を与えるように応答する。このように、対話型シナリオ30は、シナリオが更新された結果に基づく次画面指示を、Web制御IF20に与える(ステップS305)。ステップS305により与えられた次画面指示に基づく画面応答を、Web制御IF20が、端末装置50へ送信する(ステップS306)。ステップS306により送信された画面応答に基づくテキストガイダンス情報その他の画像情報を、端末装置50が画面表示する(ステップS307)。
一方、対話型シナリオ30は、シナリオ更新(ステップS304)の結果に基づいて、次画面指示(ステップS305)とは別に、次にユーザに聞かせるべき音声ガイダンス、すなわち次音源を、音声制御IF10へ入力する(ステップS308)。つまり、ステップS308では、対話型シナリオ30が音声制御IF10へ、次音源によってシナリオ更新を通知する。ステップS308により入力された次音源を、Web制御IF20が、端末装置50へ送信する(ステップS309)。ステップS309により送信された次音源を、端末装置50が音声ガイダンスとして再生する(ステップS309)。
以下、図6〜8を用いて、パタンP1〜P3の別による接続手順に関する説明をする。なお、図6〜8は、音声ガイダンスサーバ60〜62と端末装置50との接続手順等を説明するために要点のみを簡略に示しているので、他図も適宜参照することとする。また、音声ガイダンスサーバの符号60と符号61は、説明の便宜上、区別しているが、全部の構成要素を併せ持つ共通の音声ガイダンスサーバ60があるものとみなしても良い。
(パタンP1:音声、パケットともに端末装置からサーバへ発信)
図6は、本実施形態における音声ガイダンスシステムによる、音声とパケットと同期確立するまでの接続手順のパタンP1として、音声・パケットともに端末装置からの発信である場合の説明図である。図6に示す音声ガイダンスシステム100の接続手順のパタンP1において、端末装置50と、音声ガイダンスサーバ60との間では、以下のように通信接続される。
まず、端末装置50から送信されたPB音が、音声NW70を介して音声ガイダンスサーバ60で受信される(ステップS1)。ステップS1と実質上重複する内容で、端末装置50から入力されたデータ入力信号が、パケットNW80を介して、音声ガイダンスサーバ60で受信される(ステップS3)。図6に示す接続手順のパタンP1によれば、音声・パケットともユーザから発信する場合、音声とパケットとの接続順番に対する制約はない。なお、端末装置50によっては、音声通話中に、音声信号により、音声ガイダンスサーバ60へ、ユーザの意思を伝達する方法について、例えばPB入力するか、タッチパネルにより画面入力するか、いずれかにデフォルト設定されている場合もある。
(パタンP2:端末装置からサーバへ発呼した後、重ねて端末装置からパケット接続)
図7は、本実施形態における音声ガイダンスシステムによる、音声とパケットと同期確立するまでの接続手順のパタンP2として、端末装置からサーバに音声接続後、さらに端末装置からパケットの接続要求する場合の説明図である。図7に示す音声ガイダンスサーバ61には、説明に必要最小限の構成要素として、パケット通信セッション確立判断部36と、パケット通信セッション確立指令部37と、対話型シナリオ30とを明示している。パケット通信セッション確立判断部36は、状況に応じてパケット通信セッションをいつ確立させるかを判断する。また、パケット通信セッション確立指令部37は、パケット通信セッション確立判断部36が、パケット通信セッションを確立させるべきことを判断した時に、パケット通信セッションを確立させるように端末装置50に要求する。
図7に示す接続手順のパタンP2において、端末装置50と、音声ガイダンスサーバ61との間では、以下のように通信接続される。まず、端末装置50で入力されたPB音が、音声NW70を介して音声ガイダンスサーバ61で受信される(ステップS1)。このPB音を受信した音声ガイダンスサーバ61は、パケット通信セッション確立判断部36が、ガイダンスシナリオ31に基づいて、パケット通信セッションを確立させるべきだと判断する。そのパケット通信セッション確立判断部36の判断に基づいて、パケット通信セッション確立指令部37が、パケット通信を促すためのプッシュ信号を、SMS(Short Message Service)を介して、端末装置50へ送信する(ステップS2)。このSMSについては後述する。プッシュ信号を受信した端末装置50は、端末APLを起動して音声ガイダンスサーバ61との間にパケット通信セッションを確立する。端末装置50のユーザは、電話を切らずに音声通信セッションを維持して音声ガイダンスを聞くと共に、端末APLによる画面を見ながら入力したデータ入力信号を、パケットNW80を介して、Web制御IF20へ送信する(ステップS3)。
図7に示す接続手順のパタンP2において、http通信については、WebサーバとWebブラウザ間の通信プロトコルに、サーバからのプッシュに関する技術が含まれていないため、http通信とは別経路によるプッシュ手段が必要となる。本実施形態では、一例としてSMSプッシュを行い、それを受けた端末装置50の端末APLが起動する。なお、SMSとは、携帯電話同士で短い文字メッセージを送受信できるサービスであり、相手の電話番号を指定して、全角(日本語)なら数十文字、半角(英数字)なら百数十文字程度までの文字のメッセージを、加入者間で即時に交換できるシステムである。このSMSにおいて、画像や音声等も添付できるものはMMS (Multimedia Messaging Service)と呼ばれる。なお、SMS以外の経路によるプッシュ手段(例えば前述のロングポーリングによる擬似Push)があれば、それを用いても構わない。
この音声ガイダンスサーバ61は、まず、端末装置50から音声接続が開始され、音声通信セッションのみが確立された状態となる。次に、音声ガイダンスサーバ61は、パケット通信セッション確立指令部37からの要求に応じて、端末装置50からパケット通信セッションを確立させる。その後、ガイダンス同期制御部34(図2、図12)が、音声通信セッションにより進行するガイダンスシナリオ上の遷移状態と、パケット通信セッションにより進行すべきガイダンスシナリオ上の遷移状態と、を一致させる。つまり、音声とパケットを同期させる。
また、この音声ガイダンスサーバ61には、遷移状態進行通知部43が具備されており、音声ガイダンスサーバ61から端末装置50へガイダンスシナリオ上の遷移状態の進行に応じてその更新された遷移状態を通知する。したがって、この音声ガイダンスサーバ61は、音声通信セッションのみにより音声ガイダンスを受けている状態から、必要に応じて、パケット通信セッションによるテキスト/画像を、確実に補うことが可能である。また、端末装置50側から積極的にリロードしなくても、更新されたテキスト/画像を、端末装置50で自動的に受信できる。このことにより、音声側とパケット側とのシナリオの乖離を防ぐことができる。
(パタンP2´:音声側でPB入力に失敗しても、パケット側で補う)
また、パケット通信セッション確立判断部36は、音声通信セッションのみが確立された状態で、端末装置50から入力された音声入力の内容にエラーを検出する。その検出されたエラーが規定量を超えた時、パケット通信セッション確立判断部36は、パケット通信セッション確立指令部37にパケット通信セッション確立の要求を出させる。その要求を受けて端末装置50は、パケット通信セッションを確立させる。具体的には、音声セッションにより音声信号の入力を待機する遷移状態において、ガイダンスシナリオが規定する所定時間内に、例えば、PB信号が正しく受信できなかった場合、つまりユーザのミス等の場合である。このように、音声ガイダンスサーバ61は、音声通信セッションによる音声信号の入力に所定回数以上失敗しても、新たに確立されるパケット通信セッションにより補うことが可能である。したがって、ユーザが音声入力のミスを連続しても、電話をかけ直すことなく、また解決のためのオペレータを必要とせず、無人の音声ガイダンスサーバ61を相手に、通信の目的を達成することが容易である。
一般的には、ガイダンスシナリオに定められた音声信号を、音声ガイダンスサーバから入力要求したにもかかわらず、端末装置からの入力が不備であれば対応不能となる。その場合、音声ガイダンスサーバでは「番号が認識できません。おかけ直しください」等と、対応不能である理由を説明すると共に、電話のかけ直しを促す音声ガイダンスを送信する。その後に、音声ガイダンスサーバが音声セッションを終了させる。あるいは、音声ガイダンスサーバに代わって、オペレータが音声対応する場合がある。しかし、本実施形態の構成によれば、ユーザが、音声セッション側で音声信号の入力に失敗しても、パケット通信セッション側で、テキスト/画像情報を用いて補うことが可能である。したがって、オペレータを必要とせずに通信の目的を達成しやすい。
(パタンP3:パケットで事前準備した後で、サーバから端末装置へ発呼)
図8は、本実施形態における音声ガイダンスシステムによる、音声とパケットと同期確立するまでの接続手順のパタンP3として、パケットで事前準備を行った後で、サーバから発呼する場合の説明図である。このパタンP3に示す接続順番の場合は、端末装置50に専用の端末APLをダウンロードして対応することが好ましい。図8に示す接続手順のパタンP3において、まず、ユーザが、端末装置50を操作して、端末装置50から音声ガイダンスサーバ62に接続するための端末APLを起動することにより、パケット通信セッションのみを確立して通信接続を開始する。
次に、パケット通信セッションを介して端末装置50からその端末装置50に関する電話番号等の識別子をデータ入力する。このデータ入力された端末装置50の電話番号宛に、音声ガイダンスサーバ60の音声通信セッション確立部44から電話をかけて、音声通信セッションを確立する。その後、ガイダンス同期制御部が、パケット通信側と音声通信側とを同期させる。つまり、パケット通信セッションのみにより、テキスト/画像を受けている状態で、必要に応じて、端末装置50からパケット通信セッションにより、その端末装置50の電話番号の通知を受けた後に、音声ガイダンスサーバ62から端末装置50へ電話をかけることができる。
また、音声ガイダンスサーバ60は、パケット通信セッションのみが確立された状態で、パケット通信セッションによるガイダンスシナリオ上の遷移状態が進行した後、適宜に音声セッションを確立された場合、ガイダンス同期制御部34が、パケット通信セッションにより進行するガイダンスシナリオ上の遷移状態と、音声通信セッションにより進行すべきガイダンスシナリオ上の遷移状態とを一致させる。つまり、パケット通信セッションのみにより、テキスト/画像を受信している状態で、パケット通信セッションによりテキスト/画像の遷移状態が、何段階か進行した後、適宜に、音声通信セッションにより進行すべきガイダンスシナリオ上の遷移状態を、何段階も飛び越して追いつくように一致させることができる。
あるいは、音声ガイダンスサーバ60は、音声通信セッションとパケット通信セッションとのいずれか一方が確立された状態で、確立されている通信セッションによるガイダンスシナリオ上の遷移状態が何段階か進められた後に、確立されていなかった他方の通信セッションによるガイダンスシナリオ上の遷移状態を、進行させた一方の遷移状態と一致させるべく、何段階も飛び越して追いつくように進行させてから、確立されていなかった他方の通信セッションを確立させるようにしても構わない。その場合、音声通信セッションとパケット通信セッションとのいずれか一方の通信セッションにより進行したガイダンスシナリオ上の遷移状態が、ある程度進行した後に、他方の通信セッションにより進行すべきガイダンスシナリオ上の遷移状態を一致させることができる。
(留守番電話への適用)
図9は本実施形態における音声ガイダンスシステムを留守番電話に適用した場合の動作を示すフローチャートである。図1〜8に示した音声ガイダンスサーバ60は、留守番電話サービスに適用することが可能である。図9に示すように、この音声ガイダンスサーバ60を、留守番電話という目的に応じて、ユーザが音声通話接続(ステップS400)してから切断(ステップS409)するまでの動作を、フローチャートに沿って説明する。
図9に例示する音声ガイダンスサーバ60は、留守番電話を自動で受け付けることができる専用の電話番号を備えている。この専用電話番号宛に、ユーザが、端末装置50を用いて電話をかける。すなわち、ユーザは、留守番電話の目的をかなえるように、端末装置50と音声ガイダンスサーバ60とを、音声通話可能に接続する(ステップS400)。ここで、「(ピーという)発信音のあとにメッセージを録音してください。録音後、終了するには「1」を押してください(ピー)」との音声ガイダンスが、音声ガイダンスサーバ60から端末装置50へ送信される(ステップS401)。
ステップS401の音声ガイダンスに沿って、ユーザは録音する(ステップS402)。ステップS402で録音完了したユーザは、ステップS401で届けられた「録音後、終了するには「1」を押してください」との音声ガイダンスに沿って、「1」を押すと、次の音声ガイダンスが届けられる(ステップS403)。ステップS403では、「いま録音したメッセージでよければ「1」を、変更するには「2」を、確認するには「3」を、メッセージを取り消して終了するには「9」を、押してください」という音声ガイダンスにより、ユーザに4者択一の意思表示を求める。ユーザは、音声ガイダンスサーバ60からの求めに応じて4者択一の意思表示するため、PB操作する(ステップS404)。このとき、ユーザは、端末装置50をPB操作することにより、上述したPB音を出力し、音声ガイダンスサーバ60に、自分の意思を伝えることができる。
ステップS404で、ユーザが「1」を押すと、録音したメッセージが音声ガイダンスサーバ60保存される。この時、「メッセージをお預かりしました」との音声ガイダンスが、音声ガイダンスサーバ60から端末装置50へ送信される(ステップS407)。このステップS407が実行された後に、接続中の電話が切断(呼が切断)される(ステップS409)。また、ユーザが「2」を押すと、録音内容を変更することができる。すなわち、ステップS401に戻って録音をやり直すことができる。ユーザが「3」を押すと、録音音声を音声ガイダンスサーバ60が再生し、その録音音声を端末装置50に送信するので、ユーザは、その録音音声を聞いて確認することができる(ステップS405)。ユーザが「9」を押すと、メッセージを取り消して終了する。この時、「メッセージを取り消しました」との音声ガイダンスが音声ガイダンスサーバ60から端末装置50へ送信される(ステップS408)。このステップS408が実行された後に、接続中の電話が切断(呼が切断)される(ステップS409)。
(ユーザ認証への適用)
図10は本実施形態における音声ガイダンスシステムを、ユーザ認証に適用した場合の動作を示すフローチャートである。また、図12や他の図面も適宜参照しながら説明する。図10に示す端末装置50は、いわゆるスマートフォンである。この端末装置50は、不図示の音声送受信部と、パケット送受信部と、を備えている。音声送受信部は、携帯電話網(図1に示す音声NW70)による音声通話を行う。また、パケット送受信部は、ブラウザを用いて情報ネットワーク(図1に示すパケットNW80)から画像情報を閲覧する。端末装置50は、これらの音声送受信部と、パケット送受信部とを、同時に利用することが可能である。また、この端末装置50は、図1〜8に示した音声ガイダンスサーバ60に接続し、ユーザの目的に応じたコミュニケーションを行うことが可能である。
このユーザが、ネット展開型サービス機関(以下、単にサービス機関という)の会員になったという前提で説明する。会員であるユーザは、そのサービス機関から提供される専用端末APLを、端末装置50にダウンロードしており、そのサービス機関に属する音声ガイダンスサーバ60と通信することができる状態である。また、端末装置50にダウンロードされた専用端末APLには、図2の右下に示す音声ガイダンスサーバ60との同期を確立し、維持するためのサーバプッシュ同期部9が含まれている。サーバプッシュ同期部9は、図4に沿って説明したS209、S210で示した機能を有している。したがって、端末装置50側から積極的にリロードの操作をしなくても、更新されたテキスト/画像を、端末装置50で自動的に受信できる。なお、サービス機関の例として金融機関をはじめ、人材斡旋機関等がある。
まず、ユーザは、サービス機関に属する音声ガイダンスサーバ60に対してコミュニケーションを行うために、端末装置50の電話機能により発呼し、既に通話接続状態になっている段階から説明する。この段階で、ユーザは、希望する取引を開始するために、端末装置50における音声通話を維持したままに、端末装置50のブラウザを用いて、音声ガイダンスサーバ60と、パケット通信セッションによる通信も接続する(ステップS500)。ただし、このステップS500において、Web通信接続する時、端末装置50の音声送受信部によって既に通話中であるか否かはどちらでもよく、音声通話のない状態から、直接に、音声ガイダンスサーバ60とWeb通信接続しても構わない。つまり、端末装置50には、電話の発呼とWeb通信接続と、いずれが先でも構わないような端末APLがダウンロードされている。
ここで、音声ガイダンスサーバ60において、パケット通信セッションによるコミュニケーションの進捗と、音声通信セッションによるコミュニケーションの進捗とは、同期する(ステップS501)。なお、上述したように、このステップS501で同期確立する手順は、図6〜図8で説明したパタンP1〜P3のいずれでも構わない。ステップS501により、パケット通信セッションによるコミュニケーションの進捗と、音声通信セッションによるコミュニケーションの進捗と、同期したならば、「お客様の会員番号を入力してください」との音声ガイダンスが、画面G1の表示と同期して音声受信部により届けられる(ステップS502)。
音声ガイダンスサーバ60と端末装置50とが通信可能に接続されたならば、図10の画面G1に示すように、会員番号入力枠57を明示したXXサービス認証画面が、端末装置50の液晶表示部に表示されて、入力待ちの状態となる(ステップS503)。スマートフォンの多くは、周知のように、パーソナルコンピュータのマウスクリック入力に匹敵するような画面からの入力部として、タッチパネル方式による画面からの入力部が具備されている。端末装置50は、このタッチパネル方式によって、音声通話中にPB信号の送信が可能なだけでなく、音声通話中にデータ入力も可能である。つまり、パケット通信セッションにより画面の中に表示されたボタンを押すほか、キーボード等をイメージする画面の中の文字または数字キーを押して入力することが可能である。あるいは、端末装置50を用いるユーザが、電話音声により該当する番号を読み上げて音声ガイダンスサーバ60に送信しても良い。その場合は、音声ガイダンスサーバ60の音声制御IF10に具備された図示せぬ音声認識部が、ユーザの口頭による番号提示を数字に変換して受け付ける。
ここで、ユーザが音声ガイダンスサーバ60からの求めに応じて、本人の会員番号を間違いなく入力すると、次に「暗証番号を入力してください」との音声ガイダンスが、画面G1の表示と同期して音声受信部により届けられる(ステップS504)。なお、ユーザが会員番号を都度入力するまでもなく、会員番号入力枠57に正しくデフォルト表示された会員番号を、ユーザが確認した後に、画面G1の下方にある確認ボタン59を押すだけにしても良い。このことで、会員番号が正しく入力されたことを、音声ガイダンスサーバ60が認識して処理を進められる。
図10の画面G1に示すように、暗証番号入力枠58も含めて明示されたXXサービス認証画面が、端末装置50の液晶表示部に表示されている。したがって、画面G1で入力待ちの状態となる(ステップS505)。ここで、ユーザが音声ガイダンスサーバ60からの求めに応じて、本人の暗証番号を間違いなく入力すれば、認証処理が成功する(ステップS506)。このステップS506のタイミングで、図10の画面G2の表示と同期した音声ガイダンスが、音声ガイダンスサーバ60から端末装置50に届けられる(ステップS507)。ステップS507では、「いつもXXサービスをご利用いただき、ありがとうございます。お知らせを確認するには1を、・・・ 」との音声ガイダンスを、ユーザは、聞くことができる。
ステップS506により認証が成功した後、ユーザは、音声ガイダンスサーバ60に求めるサービスを受けられる。すなわち、ユーザは、上述した音声ガイダンスを受けながら進める音声通信セッションによるコミュニケーションの進捗と、図10の画面G2の表示に沿ったパケット通信セッションによるコミュニケーションの進捗と、同期したコミュニケーションを継続することができる。そして、ユーザは、求めるサービスを、音声ガイダンスサーバ60から受けるか、あるいは音声ガイダンスサーバ60との取引を実行する(ステップS508)。なお、ステップS508以降のサービス処理についての記載は、図10から省略する。ステップS508において、音声ガイダンスサーバ60が、例えば、金融機関に属するサービス対応に連動するのであれば、ユーザの取引口座を確認して、ユーザの指定どおりの金額を指定口座へ振り込むようなシステムに働きかける。なお、図10の例示では、電話をかけた後に、ステップS500でWeb通信接続している。すなわち、図7に沿って説明した要領である。しかし、逆の順番によりWeb通信接続を先にして、後から電話をかけるようにしても構わない。すなわち、図8に沿って説明した要領でも構わない。さらに、Web通信接続を先にして、途中で音声ガイダンスサーバ60から端末装置50へ電話をかけさせるようにしても構わない。すなわち、図9に沿って説明した要領でも構わない。
(要点1)
次に、図11および図12を用いて、同期の手順を要点のみ抽出して説明する。図11は本実施形態における音声ガイダンス方法および音声ガイダンスプログラムの要点のみを示すフローチャートである。図11に示すように、まず、端末装置50との間で音声通信セッションを介して音声信号を送受信する(ステップS801)。次に、ステップS801に示す音声送受信処理に伴う音声ガイダンスのガイダンスシナリオ上の遷移状態を、ガイダンス遷移状態保持部35に保持する(ステップS803)。同様に、端末装置50との間でパケット通信セッションを介してパケットデータを送受信する(ステップS802)。次に、ステップS802に示すパケット送受信処理に伴うテキスト/画像のガイダンスシナリオ上の遷移状態を、ガイダンス遷移状態保持部35に保持する(ステップS803)。
ステップS803に示すガイダンス遷移状態保持処理により保持される遷移状態に従って、端末装置50に対し、ステップS801に示す音声送受信処理による音声ガイダンスを、送信制御する(ステップS804)。同様に、ステップS803に示すガイダンス遷移状態保持処理により保持される遷移状態に従って、端末装置50に対し、パケット送受信処理によるテキスト/画像を、送信制御する(ステップS804)。
端末装置50から、ステップS801に示す音声送受信処理により音声ガイダンスに対する応答音声信号を、端末装置50から応答受信制御する(ステップS805)。同様に、ステップS802に示すパケット送受信処理によりテキスト/画像に対する応答パケットデータを、端末装置50から応答受信制御する(ステップS805)。ステップS805に示す応答受信制御処理によって、応答音声信号および応答パケットデータのいずれか一方が受信されると、ステップS803に示すガイダンス遷移状態保持処理により保持される(ステップS803)。
受信された応答音声信号または応答パケットデータに対応する一方の遷移状態を進行させると共に、他方の遷移状態を、進行させた一方の遷移状態と一致させるべく進行させるようにガイダンス同期制御する(ステップS806)。このよう端末装置50において、通話状態で受ける音声ガイダンスを聞きながら、その音声ガイダンスの遷移状態と一致したテキスト/画像を、適宜に表示させられるので利便性が高められる。なお、ステップS801に示す音声通信セッションと、ステップS802に示すパケット送受信処理とは、どちらが先に実行されても構わない。また、ステップS801〜ステップS806の各処理は、順番を前後しながらセッションが終了するまで繰り返される。
(要点2)
図12は、本実施形態における音声ガイダンスシステムにより、音声通信側とパケット通信側のいずれか一方からの入力により、両方のガイダンスの遷移状態を同期させるシーケンス図である。図12に示す音声ガイダンスシステム100は、音声ガイダンスサーバ60と、その音声ガイダンスサーバ60に対して、音声通信セッション94およびパケット通信セッション95の両方による通信を同時に行うことが可能な端末装置50と、その端末装置50から音声ガイダンスサーバ60までの間に介在する音声NW70と、端末装置50から音声ガイダンスサーバ60までの間に介在するパケットNW80と、より構成されている。
既に説明したように、音声ガイダンスサーバ60は、端末装置50へ対話式で音声ガイダンスを提供可能である。この音声ガイダンスサーバ60は、音声送受信部41と、パケット送受信部42と、ガイダンス遷移状態保持部35と、応答受信制御部39と、ガイダンス同期制御部34と、を備えている。ただし、図12には、ガイダンスの遷移状態を同期させる説明に必要最小限の構成要素のみを抽出して記載している。また、音声送受信部41は、音声送信部90と音声受信部91とを含んで構成され、パケット送受信部42は、パケット送信部92とパケット受信部93とを含んで構成されている。音声送受信部41は、端末装置50との間で音声通信セッションを介して音声信号を送受信する。パケット送受信部42は、端末装置50との間でパケット通信セッション95を介してパケットデータを送受信する。
ガイダンス送信制御部38は、ガイダンス遷移状態保持部35により保持される遷移状態情報に従って、端末装置50に対し、音声送受信部41により音声ガイダンスを送信制御する。同様に、ガイダンス送信制御部38は、パケット送受信部42によりテキスト/画像を、それぞれ送信制御する。応答受信制御部39は、音声ガイダンスに対する端末装置50からの応答音声信号を、音声送受信部により受信制御する。同様に、この応答受信制御部39は、テキスト/画像に対する端末装置50からの応答パケットデータを、パケット送受信部42により受信制御する。ガイダンス送信制御部38および応答受信制御部39は、図1、図2には明示していないが、対話型シナリオ30に含まれている。
ガイダンス遷移状態保持部35は、ガイダンスシナリオ上の音声ガイダンスと、およびガイダンスシナリオ上のテキスト/画像との遷移状態情報をそれぞれ保持することができる。そして、ガイダンス同期制御部34は、ガイダンス遷移状態保持部35に、応答音声信号および応答パケットデータのいずれか一方が受信されると、受信された応答音声信号または応答パケットデータに対応する一方の遷移状態を進行させた遷移状態情報を保持させる。そして、ガイダンス同期制御部34は、ガイダンス遷移状態保持部35に、他方の遷移状態情報を、進行させた一方の遷移状態情報と一致させるべく進行させて保持させる。ガイダンス送信制御部38は、ガイダンス遷移状態保持部35で一致して保持された遷移状態情報に基づいて、音声ガイダンスと、テキスト/画像との、遷移状態を一致させた状態で送信するように制御する。
したがって、端末装置50では、音声ガイダンスと、テキスト/画像とを、一致した遷移状態で受信できる。このように、端末装置50において、通話状態で音声ガイダンスを聞きながら、その音声ガイダンスと遷移状態の一致したテキスト/画像を、適宜に表示させることができるので利便性が高められる。これら一連の信号の流れを、以下に説明する。
まず、音声ガイダンスサーバ60の音声受信部91は、端末装置50から送信されたPB信号を音声受信する(ステップS900)。ステップS900で、音声受信部91がPB信号を受信すると、音声受信部91は、そのPB信号が音声ガイダンスのどの遷移状態であるかを特定する遷移状態情報を、ガイダンス遷移状態保持部35へ出力する。この遷移状態情報は、ガイダンス遷移状態保持部35に記憶される(ステップS901)。
このように、端末装置50から音声通信セッション94によるPB信号(ステップS900)またはパケット通信セッション95によるデータ入力信号(ステップS905)の少なくとも一方が、音声ガイダンスサーバ60で受信される。その受信された方の信号に基づいてガイダンスの遷移状態が進むことに応じて、受信されていない他方のガイダンスの遷移状態も一致して進めるように更新された遷移状態情報を記憶する(ステップS901)。
ステップS901により、ガイダンス遷移状態保持部35に更新して記憶された遷移状態情報は、ガイダンス同期制御部34に入力される。ガイダンス同期制御部34は、ステップS901で更新された遷移状態情報に基づくように同期させた音声ガイダンスおよびテキスト/画像が、次に送信すべきガイダンスとして準備されるように、ガイダンス送信制御部38に準備させる(S902)。
音声送信部90は、ステップS902で遷移状態を同期された音声ガイダンスを、音声通信セッション94により、端末装置50へ送信する(ステップS903)。パケット送信部92は、ステップS902で遷移状態を同期されたテキスト/画像を、パケット通信セッション95により、端末装置50へ送信する(ステップS905)。このステップS903とステップS905とにおいて、それぞれ送信される、音声ガイダンスの遷移状態と、テキスト/画像の遷移状態は一致している。したがって、端末装置50において、音声ガイダンスを聞きながら、その音声ガイダンスの遷移状態と一致したテキスト/画像を、適宜に表示させられるので、利便性が高められる。
(まとめ)
一般的な電話機を利用して不在配達物を再配達依頼する等、周知慣用された音声ガイダンスサービスの延長上に、本システム100も位置付けられている。したがって、本システム100の使用方法は、だれにでも馴染み易い。しかしながら、周知慣用された音声ガイダンスサービスにおいて、例えば、通話状態で受ける音声ガイダンスで提示された複数の選択肢から、ユーザの選択に応じて意思表示を求められた際、ユーザは選択肢の内容とそれに対応して押すべきPBの番号との対応付け等を、とっさに記憶できずに当惑する場合がある。そのような場合、ユーザはメモを取る必要に迫られる等、不便を解消する技術は含まれていない。そのような場合でも、本実施形態に係る音声ガイダンスシステムによれば、端末装置において、音声ガイダンスを聞きながら、その音声ガイダンスの遷移状態と一致したテキスト/画像を適宜に表示させることができる。したがって、ユーザにとって、メモを取る手間が省けて便利である。
一方、特許文献1に開示された音声蓄積サーバに蓄積された音声情報とデータ利用サーバに蓄積されたデータ情報とを結びつける方法において、音声通話を維持しながらアプリケーションを実行し、そのアプリケーションを用いたデータの入出力等を行うことはできない(特許文献1の段落[0024][0028]参照)。さらに、特許文献1の技術では、結びつけられた音声情報およびデータ情報の2種類を、送信先の携帯電話機で受信する際も、電話機能による音声通話を維持しながら、同時にWebブラウザ機能によりWebデータを閲覧することはできない。
例えば、Webサーバに記録されている写真のデータ情報と留守番電話の音声情報とを、送信先の携帯電話機で受信する際は、電話を切った状態で、主にWebブラウザ機能を用いて、写真を閲覧し、音声も再生する。つまり、特許文献1に開示の技術では、音声ガイダンスを聞きながら、それと同一内容の文字/画像による支援を受けることはできなかった。特に、遂次的にしか聞き取れない音声を、静止状態で一覧可能な文字/画像による同一内容の補完はできなかった。
(本実施形態の主な効果)
(1)本実施形態によれば、端末装置において、通話状態で受ける音声ガイダンスを聞きながら、その音声ガイダンスの遷移状態と一致したテキスト/画像を、適宜に表示させられるので利便性が高められる。
(2)また、パケット通信セッション確立判断部の判断により、音声ガイダンスに加えて、パケット通信セッションが確立されるので、ガイダンスシナリオの内容によっては、きわめて有用である。例えば、文字/画像による補足説明が必要なシナリオの場合には親切なサービス対応が可能となる。
(3)また、サーバからプッシュボタン等の音声入力を要求された時に、適切な入力ができなかった等、「おかけ直しください」等のガイダンスを伴って、電話が切られる等により、概ね電話をかけ直す必要がある。通信の目的を達成するために、オペレータの対応を必要とする場合もある。そのような場合、すなわち、音声通信セッションによる音声信号の入力に失敗しても、パケット通信セッションにより補うことが可能である。したがって、オペレータを必要とせずに通信の目的を達成しやすい。
(4)また、音声ガイダンスを受けている状態で、必要に応じて、確実にテキスト/画像で補うことができると便利である。例えば、一般的な端末装置のWebブラウザにおいて、受け身のままでは、最新のテキスト/画像を得ることができない。つまり、パケット通信の相手である音声ガイダンスサーバに対して、端末装置から積極的にリロードしない限り、表示済みのページを再度サーバから取得して更新されることはない。また、このような場合にも、音声通信セッションのみによる音声ガイダンスを受けている状態で、必要に応じて、パケット通信セッションによるテキスト/画像で補うことが可能である。また、端末装置側から積極的にリロードしなくても、更新されたテキスト/画像を、端末装置で自動的に受信できる。
(5)また、パケット通信セッションのみにより、テキスト/画像を受けている状態で、必要に応じて、端末装置からパケット通信セッションにより、その端末装置の電話番号等、識別子の通知を受けた後に、音声ガイダンスサーバから端末装置へ電話をかけることができる。
(6)また、シナリオ上の遷移状態を音声ガイダンスサーバから端末装置へ通知することができる。したがって、音声側とパケット側とのシナリオの乖離を防ぐことができる。
(7)また、音声通信セッションとパケット通信セッションとのいずれか一方の通信セッションにより進行したガイダンスシナリオ上の遷移状態が、複数回進行した後に、他方の通信セッションにより進行すべきガイダンスシナリオ上の遷移状態を一致させることができる。
(本実施形態の別の効果)
さらに、本実施形態によれば、従来の対話シナリオを具備する音声ガイダンスシステムの利便性に加えて、次に示す顕著な効果も得られる。
(1)音声ガイダンスとして読み上げる複数の選択肢を画面上にも表示することにより、操作性を向上させられる。
(2)例えば、長い桁の文字や数字を入力する場合に、入力内容を画面上で確認した後でサーバ側に送信することが可能となる。特に、端末装置の画面上で間違いないことを確認した後、図10に示した「確認」ボタン59を押す等の入力方法を使えるので、入力間違いを低減しやすい。
(3)TCP(Transmission Control Protocol)を用いる場合、本実施形態に係る音声ガイダンスシステムのシステムパケット受信部においては、入力操作された内容の途中だけが抜け落ちる不具合も解消できる。つまり、TCPのように、一般的かつ信頼性のある伝送プロトコルにより、端末装置を用いて入力操作された内容は、音声ガイダンスサーバへ確実に到達する。このことは、電波環境が不安定な場所での音声受信部においては、通話の途切れた期間に情報欠落の発生を免れないことに対して、パケット受信部においては、入力操作された内容の途中だけが抜け落ちたりしないことを意味する。
なお、本発明の範囲は、図示され記載された例示的な実施形態に限定されるものではなく、本発明が目的とするものと均等な効果をもたらすすべての実施形態をも含む。さらに、本発明の範囲は、各請求項により画される発明の特徴の組み合わせに限定されるものではなく、すべての開示されたそれぞれの特徴のうち特定の特徴のあらゆる所望する組み合わせによって画されうる。
本発明は、音声通話を維持し、その音声通話と同期を保ちながら、提供される音声と、文字/画像と、による2系統の案内により、双方向のコミュニケーションが快適になる音声ガイダンスに利用することができる。
10 音声制御IF(音声送受信部)
12 ガイダンス送出/PB認識部
20 Web制御IF(パケット送受信部)
34 ガイダンス同期制御部
35 ガイダンス遷移状態保持部
38 ガイダンス送信制御部(対話型シナリオ)
39 応答受信制御部(対話型シナリオ)
41 音声送受信部
42 パケット送受信部
43 遷移状態進行通知部
44 音声通信セッション確立部
50 端末装置
60,61 音声ガイダンスサーバ
94 音声通信セッション
95 パケット通信セッション
100 音声ガイダンスシステム

Claims (12)

  1. 端末装置へ対話式で音声ガイダンスを提供可能な音声ガイダンスサーバであって、
    前記端末装置との間で音声通信セッションを介して音声ガイダンスを音声信号として送受信する音声送受信部と、
    前記端末装置と自サーバとの間に、予め確立された音声通信セッションに加えてパケット通信セッションを確立すべきか否かを判断するパケット通信セッション確立判断部と、
    前記パケット通信セッション確立判断部により前記パケット通信セッションを確立すべきと判断された場合に、前記端末装置から前記パケット通信セッションの確立を要求させるパケット通信セッション確立指令を前記端末装置に通知するパケット通信セッション確立指令部と、
    前記端末装置との間で確立されたパケット通信セッションを介してテキスト/画像をパケットデータとして送受信するパケット送受信部と、
    前記音声ガイダンスのガイダンスシナリオ上の遷移状態および前記テキスト/画像のガイダンスシナリオ上の遷移状態をそれぞれ保持するガイダンス遷移状態保持部と、
    前記ガイダンス遷移状態保持部により保持される前記遷移状態に従って、前記端末装置に対し、前記音声送受信部により前記音声ガイダンスを、および前記パケット送受信部により前記テキスト/画像を、それぞれ送信制御するガイダンス送信制御部と、
    前記端末装置から、前記音声送受信部により前記音声ガイダンスに対する応答音声信号を、または、前記パケット送受信部により前記テキスト/画像に対する応答パケットデータを、受信制御する応答受信制御部と、
    前記応答音声信号および前記応答パケットデータのいずれか一方が受信されると、前記ガイダンス遷移状態保持部により保持され、受信された応答音声信号または応答パケットデータに対応する一方の遷移状態を進行させると共に、他方の遷移状態を、進行させた前記一方の遷移状態と一致させるべく進行させるガイダンス同期制御部と、
    を具備し、
    前記パケット通信セッション確立指令部は、前記ガイダンスシナリオ上の前記遷移状態の変化に対応して、前記端末装置に通知される前記パケット通信セッション確立指令を、前記音声通信セッションを介して前記端末装置へプッシュ通知する
    ことを特徴とする音声ガイダンスサーバ。
  2. 記ガイダンス同期制御部は、前記パケット通信セッション確立指令部により通知された前記パケット通信セッション確立指令に応答して前記端末装置により確立されたパケット通信セッションと、前記予め確立された音声通信セッションとをそれぞれ介した前記テキスト/画像および前記音声ガイダンスの前記ガイダンスシナリオ上の前記遷移状態を同期させることを特徴とする請求項1に記載の音声ガイダンスサーバ。
  3. 前記パケット通信セッション確立判断部は、前記音声通信セッションを介して前記端末装置に送信された前記音声ガイダンスに応答して、前記端末装置から受信される前記応答音声信号が、所定回数以上、前記ガイダンスシナリオ上の入力誤りと判断される場合には、前記パケット通信セッションを確立すべきと判断することを特徴とする請求項1又は2に記載の音声ガイダンスサーバ。
  4. 前記端末装置に対して、前記ガイダンスシナリオ上の前記遷移状態の進行を通知する遷移状態進行通知部をさらに具備することを特徴とする請求項1乃至請求項のいずれか1項に記載の音声ガイダンスサーバ。
  5. 前記ガイダンス同期制御部は、前記応答音声信号および前記応答パケットデータのいずれか一方が受信されると、前記ガイダンス遷移状態保持部により保持され、受信された応答音声信号または応答パケットデータに対応する一方の遷移状態を進行させると共に、他方の遷移状態は、前記一方の遷移状態が複数回進行した後に、複数回進行させた前記一方の遷移状態と一致させるべく進行させることを特徴とする請求項1乃至請求項のいずれか1項に記載の音声ガイダンスサーバ。
  6. 端末装置へ対話式で音声ガイダンスを提供可能な音声ガイダンスサーバであって、
    前記端末装置との間で音声通信セッションを介して音声ガイダンスを音声信号として送受信する音声送受信部と、
    前記端末装置と自サーバとの間に、予め確立された音声通信セッションに加えてパケット通信セッションを確立すべきか否かを判断するパケット通信セッション確立判断部と、
    前記パケット通信セッション確立判断部により前記パケット通信セッションを確立すべきと判断された場合に、前記端末装置から前記パケット通信セッションの確立を要求させるパケット通信セッション確立指令を前記端末装置に通知するパケット通信セッション確立指令部と、
    前記端末装置との間でパケット通信セッションを介してテキスト/画像をパケットデータとして送受信するパケット送受信部と、
    前記音声ガイダンスおよび前記テキスト/画像のガイダンスシナリオ上の遷移状態をそれぞれ保持するガイダンス遷移状態保持部と、
    前記ガイダンス遷移状態保持部により保持される前記遷移状態に従って、前記端末装置に対し、前記音声送受信部により前記音声ガイダンスを、および前記パケット送受信部により前記テキスト/画像を、それぞれ送信制御するガイダンス送信制御部と、
    前記端末装置から、前記音声送受信部により前記音声ガイダンスに対する応答音声信号を、または、前記パケット送受信部により前記テキスト/画像に対する応答パケットデータを、受信制御する応答受信制御部と、
    前記応答音声信号および前記応答パケットデータのいずれか一方が受信されると、前記ガイダンス遷移状態保持部により保持され、受信された応答音声信号または応答パケットデータに対応する一方の遷移状態を進行させると共に、他方の遷移状態を、進行させた前記一方の遷移状態と一致させるべく進行させるガイダンス同期制御部と、
    を具備し、
    前記ガイダンス同期制御部は、前記パケット通信セッション確立指令部により通知された前記パケット通信セッション確立指令に応答して前記端末装置により確立されたパケット通信セッションと、前記予め確立された音声通信セッションとをそれぞれ介した前記テキスト/画像および前記音声ガイダンスの前記ガイダンスシナリオ上の前記遷移状態を同期させ、
    前記パケット通信セッション確立判断部は、前記音声通信セッションを介して前記端末装置に送信された前記音声ガイダンスに応答して、前記端末装置から受信される前記応答音声信号が、所定回数以上、前記ガイダンスシナリオ上の入力誤りと判断される場合には、前記パケット通信セッションを確立すべきと判断する
    ことを特徴とする音声ガイダンスサーバ。
  7. 端末装置へ対話式で音声ガイダンスを提供可能な音声ガイダンスサーバであって、
    前記端末装置との間で音声通信セッションを介して音声ガイダンスを音声信号として送受信する音声送受信部と、
    前記端末装置との間でパケット通信セッションを介してテキスト/画像をパケットデータとして送受信するパケット送受信部と、
    前記音声ガイダンスおよび前記テキスト/画像のガイダンスシナリオ上の遷移状態をそれぞれ保持するガイダンス遷移状態保持部と、
    前記ガイダンス遷移状態保持部により保持される前記遷移状態に従って、前記端末装置に対し、前記音声送受信部により前記音声ガイダンスを、および前記パケット送受信部により前記テキスト/画像を、それぞれ送信制御するガイダンス送信制御部と、
    前記端末装置から、前記音声送受信部により前記音声ガイダンスに対する応答音声信号を、または、前記パケット送受信部により前記テキスト/画像に対する応答パケットデータを、受信制御する応答受信制御部と、
    前記応答音声信号および前記応答パケットデータのいずれか一方が受信されると、前記ガイダンス遷移状態保持部により保持され、受信された応答音声信号または応答パケットデータに対応する一方の遷移状態を進行させると共に、他方の遷移状態を、進行させた前記一方の遷移状態と一致させるべく進行させるガイダンス同期制御部と、
    前記音声通信セッションが確立される前に、前記パケット送受信部により前記パケット通信セッションを介して前記端末装置から前記端末装置の識別子が受信された場合に、受信された識別子を有する端末装置に対して前記音声送受信部により音声通話発信を行うことにより、前記端末装置への音声通信セッションを確立する音声通信セッション確立部と、
    を具備し、
    前記ガイダンス同期制御部は、前記音声通信セッション確立部により前記端末装置に対して確立された音声通信セッションと、前記端末装置に対して予め確立されたパケット通信セッションとをそれぞれ介した前記音声ガイダンスおよび前記テキスト/画像の前記ガイダンスシナリオ上の前記遷移状態を同期させる
    ことを特徴とする音声ガイダンスサーバ。
  8. 端末装置へ対話式で音声ガイダンスを提供可能な音声ガイダンスサーバであって、
    前記端末装置との間で音声通信セッションを介して音声ガイダンスを音声信号として送受信する音声送受信部と、
    前記端末装置との間でパケット通信セッションを介してテキスト/画像をパケットデータとして送受信するパケット送受信部と、
    前記音声ガイダンスおよび前記テキスト/画像のガイダンスシナリオ上の遷移状態をそれぞれ保持するガイダンス遷移状態保持部と、
    前記ガイダンス遷移状態保持部により保持される前記遷移状態に従って、前記端末装置に対し、前記音声送受信部により前記音声ガイダンスを、および前記パケット送受信部により前記テキスト/画像を、それぞれ送信制御するガイダンス送信制御部と、
    前記端末装置から、前記音声送受信部により前記音声ガイダンスに対する応答音声信号を、または、前記パケット送受信部により前記テキスト/画像に対する応答パケットデータを、受信制御する応答受信制御部と、
    前記応答音声信号および前記応答パケットデータのいずれか一方が受信されると、前記ガイダンス遷移状態保持部により保持され、受信された応答音声信号または応答パケットデータに対応する一方の遷移状態を進行させると共に、他方の遷移状態を、進行させた前記一方の遷移状態と一致させるべく進行させるガイダンス同期制御部と、
    前記端末装置に対して、前記ガイダンスシナリオ上の前記遷移状態の進行を通知する遷移状態進行通知部と、
    を具備することを特徴とする音声ガイダンスサーバ。
  9. 端末装置へ対話式で音声ガイダンスを提供可能な音声ガイダンスサーバであって、
    前記端末装置との間で音声通信セッションを介して音声ガイダンスを音声信号として送受信する音声送受信部と、
    前記端末装置との間でパケット通信セッションを介してテキスト/画像をパケットデータとして送受信するパケット送受信部と、
    前記音声ガイダンスおよび前記テキスト/画像のガイダンスシナリオ上の遷移状態をそれぞれ保持するガイダンス遷移状態保持部と、
    前記ガイダンス遷移状態保持部により保持される前記遷移状態に従って、前記端末装置に対し、前記音声送受信部により前記音声ガイダンスを、および前記パケット送受信部により前記テキスト/画像を、それぞれ送信制御するガイダンス送信制御部と、
    前記端末装置から、前記音声送受信部により前記音声ガイダンスに対する応答音声信号を、または、前記パケット送受信部により前記テキスト/画像に対する応答パケットデータを、受信制御する応答受信制御部と、
    前記応答音声信号および前記応答パケットデータのいずれか一方が受信されると、前記ガイダンス遷移状態保持部により保持され、受信された応答音声信号または応答パケットデータに対応する一方の遷移状態を進行させると共に、他方の遷移状態を、進行させた前記一方の遷移状態と一致させるべく進行させるガイダンス同期制御部と、を具備し、
    前記ガイダンス同期制御部は、前記応答音声信号および前記応答パケットデータのいずれか一方が受信されると、前記ガイダンス遷移状態保持部により保持され、受信された応答音声信号または応答パケットデータに対応する一方の遷移状態を進行させると共に、他方の遷移状態は、前記一方の遷移状態が複数回進行した後に、複数回進行させた前記一方の遷移状態と一致させるべく進行させることを特徴とする音声ガイダンスサーバ。
  10. 端末装置へ対話式で音声ガイダンスを提供可能とする音声ガイダンスサーバを用いた音声ガイダンス方法であって、
    前記音声ガイダンスサーバは、
    前記端末装置との間で音声通信セッションを介して音声ガイダンスを音声信号として送受信する音声送受信部と、
    前記端末装置と自サーバとの間に、予め確立された音声通信セッションに加えてパケット通信セッションを確立すべきか否かを判断するパケット通信セッション確立判断部と、
    前記パケット通信セッション確立判断部により前記パケット通信セッションを確立すべきと判断された場合に、前記端末装置から前記パケット通信セッションの確立を要求させるパケット通信セッション確立指令を前記端末装置に通知するパケット通信セッション確立指令部と、
    前記端末装置との間で確立されたパケット通信セッションを介してテキスト/画像をパケットデータとして送受信するパケット送受信部と、
    前記音声ガイダンスのガイダンスシナリオ上の遷移状態および前記テキスト/画像のガイダンスシナリオ上の遷移状態をそれぞれ保持するガイダンス遷移状態保持部と、を具備すると共に、
    前記音声送受信部が、前記端末装置との間で前記音声通信セッションを介して前記音声信号を送受信する音声送受信ステップと、
    前記パケット通信セッション確立判断部が、前記端末装置と自サーバとの間に、予め確立された音声通信セッションに加えてパケット通信セッションを確立すべきか否かを判断するパケット通信セッション確立判断ステップと、
    前記パケット通信セッション確立指令部が、前記パケット通信セッション確立判断ステップにおいて前記パケット通信セッションを確立すべきと判断された場合に、前記端末装置から前記パケット通信セッションの確立を要求させるパケット通信セッション確立指令を前記端末装置に通知するパケット通信セッション確立指令ステップと、
    前記パケット送受信部が、前記端末装置との間で確立されたパケット通信セッションを介してパケットデータを送受信するパケット送受信ステップと、
    前記音声ガイダンスのガイダンスシナリオ上の遷移状態および前記テキスト/画像のガイダンスシナリオ上の遷移状態をそれぞれ保持するガイダンス遷移状態保持ステップと、
    前記ガイダンス遷移状態保持ステップにより保持される前記遷移状態に従って、前記端末装置に対し、前記音声送受信部により前記音声ガイダンスを、および前記パケット送受信部により前記テキスト/画像を、それぞれ送信制御するガイダンス送信制御ステップと、
    前記端末装置から、前記音声送受信部により前記音声ガイダンスに対する応答音声信号を、または、前記パケット送受信部により前記テキスト/画像に対する応答パケットデータを、受信制御する応答受信制御ステップと、
    前記応答音声信号および前記応答パケットデータのいずれか一方が受信されると、前記ガイダンス遷移状態保持ステップにより保持され、受信された応答音声信号または応答パケットデータに対応する一方の遷移状態を進行させると共に、他方の遷移状態を、進行させた前記一方の遷移状態と一致させるべく進行させるガイダンス同期制御ステップと、を含み、
    前記パケット通信セッション確立指令ステップにおいて、前記ガイダンスシナリオ上の前記遷移状態の変化に対応して、前記端末装置に通知される前記パケット通信セッション確立指令を、前記音声通信セッションを介して前記端末装置へプッシュ通知する
    ことを特徴とする音声ガイダンス方法。
  11. 音声ガイダンスサーバとして機能するコンピュータを、端末装置へ対話式で音声ガイダンスを提供可能に動作させる音声ガイダンスプログラムであって、
    前記端末装置との間で音声通信セッションを介して音声信号を送受信する音声送受信処理と、
    前記端末装置と自サーバとの間に、予め確立された音声通信セッションに加えてパケット通信セッションを確立すべきか否かを判断するパケット通信セッション確立判断処理と、
    前記パケット通信セッション確立判断処理において前記パケット通信セッションを確立すべきと判断された場合に、前記端末装置から前記パケット通信セッションの確立を要求させるパケット通信セッション確立指令を前記端末装置に通知するパケット通信セッション確立指令処理と、
    前記端末装置との間で確立されたパケット通信セッションを介してパケットデータを送受信するパケット送受信処理と、
    前記音声ガイダンスのガイダンスシナリオ上の遷移状態およびテキスト/画像のガイダンスシナリオ上の遷移状態をそれぞれ保持するガイダンス遷移状態保持処理と、
    前記ガイダンス遷移状態保持処理により保持される前記遷移状態に従って、前記端末装置に対し、前記音声送受信処理により前記音声ガイダンスを、および前記パケット送受信処理により前記テキスト/画像を、それぞれ送信制御するガイダンス送信制御処理と、
    前記端末装置から、前記音声送受信処理により前記音声ガイダンスに対する応答音声信号を、または、前記パケット送受信処理により前記テキスト/画像に対する応答パケットデータを、受信制御する応答受信制御処理と、
    前記応答音声信号および前記応答パケットデータのいずれか一方が受信されると、前記ガイダンス遷移状態保持処理により保持され、受信された応答音声信号または応答パケットデータに対応する一方の遷移状態を進行させると共に、他方の遷移状態を、進行させた前記一方の遷移状態と一致させるべく進行させるガイダンス同期制御処理と、を含み、
    前記パケット通信セッション確立指令処理において、前記ガイダンスシナリオ上の前記遷移状態の変化に対応して、前記端末装置に通知される前記パケット通信セッション確立指令を、前記音声通信セッションを介して前記端末装置へプッシュ通知することを特徴とする音声ガイダンスプログラム。
  12. 端末装置と、
    前記端末装置へ対話式で音声ガイダンスを提供可能な音声ガイダンスサーバと、
    前記端末装置と前記音声ガイダンスサーバとの間を音声通信接続する音声ネットワークと、
    前記端末装置と前記音声ガイダンスサーバとの間をパケット通信接続するパケットネットワークと、を備えた音声ガイダンスシステムであって、
    前記音声ガイダンスサーバは、
    前記端末装置との間で音声通信セッションを介して音声信号を送受信する音声送受信部と、
    前記端末装置と自サーバとの間に、予め確立された音声通信セッションに加えてパケット通信セッションを確立すべきか否かを判断するパケット通信セッション確立判断部と、
    前記パケット通信セッション確立判断部により前記パケット通信セッションを確立すべきと判断された場合に、前記端末装置から前記パケット通信セッションの確立を要求させるパケット通信セッション確立指令を前記端末装置に通知するパケット通信セッション確立指令部と、
    前記端末装置との間で確立されたパケット通信セッションを介してパケットデータを送受信するパケット送受信部と、
    前記音声ガイダンスのガイダンスシナリオ上の遷移状態およびテキスト/画像のガイダンスシナリオ上の遷移状態をそれぞれ保持するガイダンス遷移状態保持部と、
    前記ガイダンス遷移状態保持部により保持される前記遷移状態に従って、前記端末装置に対し、前記音声送受信部により前記音声ガイダンスを、および前記パケット送受信部により前記テキスト/画像を、それぞれ送信制御するガイダンス送信制御部と、
    前記端末装置から、前記音声送受信部により前記音声ガイダンスに対する応答音声信号を、または、前記パケット送受信部により前記テキスト/画像に対する応答パケットデータを、受信制御する応答受信制御部と、
    前記応答音声信号および前記応答パケットデータのいずれか一方が受信されると、前記ガイダンス遷移状態保持部により保持され、受信された応答音声信号または応答パケットデータに対応する一方の遷移状態を進行させると共に、他方の遷移状態を、進行させた前記一方の遷移状態と一致させるべく進行させるガイダンス同期制御部と、
    を具備し、
    前記パケット通信セッション確立指令部は、前記ガイダンスシナリオ上の前記遷移状態の変化に対応して、前記端末装置に通知される前記パケット通信セッション確立指令を、前記音声通信セッションを介して前記端末装置へプッシュ通知する
    ことを特徴とする音声ガイダンスシステム。
JP2012189284A 2012-08-29 2012-08-29 音声ガイダンスサーバ、音声ガイダンス方法、音声ガイダンスプログラム、音声ガイダンスシステム Active JP5947156B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012189284A JP5947156B2 (ja) 2012-08-29 2012-08-29 音声ガイダンスサーバ、音声ガイダンス方法、音声ガイダンスプログラム、音声ガイダンスシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012189284A JP5947156B2 (ja) 2012-08-29 2012-08-29 音声ガイダンスサーバ、音声ガイダンス方法、音声ガイダンスプログラム、音声ガイダンスシステム

Publications (2)

Publication Number Publication Date
JP2014049830A JP2014049830A (ja) 2014-03-17
JP5947156B2 true JP5947156B2 (ja) 2016-07-06

Family

ID=50609110

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012189284A Active JP5947156B2 (ja) 2012-08-29 2012-08-29 音声ガイダンスサーバ、音声ガイダンス方法、音声ガイダンスプログラム、音声ガイダンスシステム

Country Status (1)

Country Link
JP (1) JP5947156B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6065574B2 (ja) * 2012-12-20 2017-01-25 沖電気工業株式会社 ガイダンスシステム、ガイダンスシステム用サーバ及びガイダンスシステム用プログラム
CN113347306B (zh) * 2021-06-17 2022-11-04 维沃移动通信(杭州)有限公司 业务名称显示方法、装置、电子设备及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8340255B2 (en) * 2009-07-07 2012-12-25 CallVU, Ltd. Interactive display response system
JP5751107B2 (ja) * 2011-09-20 2015-07-22 沖電気工業株式会社 制御サーバ、制御方法、プログラム、および制御システム

Also Published As

Publication number Publication date
JP2014049830A (ja) 2014-03-17

Similar Documents

Publication Publication Date Title
US10819839B2 (en) Operation method and system of mobile terminal
US10356235B2 (en) Operation method and system of mobile terminal
EP1986432B1 (en) Mobile communication device capable of storing video chatting log and operating method thereof
US20100246569A1 (en) Temporary connection number management system, terminal, temporary connection number management method, and temporary connection number management program
JP5877405B2 (ja) リングデータを用いたars連動データ提供システム及びその方法
US8050667B2 (en) Virtual terminal server, mobile communication terminal, communication control system, and communication control method
JP5947156B2 (ja) 音声ガイダンスサーバ、音声ガイダンス方法、音声ガイダンスプログラム、音声ガイダンスシステム
JP5628865B2 (ja) 発呼支援装置、プログラム、および方法
JP6113139B2 (ja) 携帯通信端末搭載プログラムを用いた携帯通信端末間の遠隔制御方法
KR20120080398A (ko) 통화 이력 및 연락처 데이터의 연동을 위한 클라우드 서버 및 통신 단말기와 그들의 제어방법
JP7026834B2 (ja) 通信管理装置、通信管理方法及び通信管理システム
KR20140140319A (ko) 스마트폰을 이용한 전자카드 전송방법
KR20110019266A (ko) 영상 응답 서비스 제공 시스템 및 서비스 제공 방법
KR20090034522A (ko) 사용자 감정 상태 정보 제공 장치 및 방법
JP2007336112A (ja) 遠隔レクチャーシステム、サーバ装置及びそれらに用いる遠隔レクチャー方法
JP2020067855A (ja) 安否確認システム
JP2005332179A (ja) 通信装置、通信システム及び通信方法
JP6065574B2 (ja) ガイダンスシステム、ガイダンスシステム用サーバ及びガイダンスシステム用プログラム
WO2010031319A1 (zh) 一种实现二次拨号的方法及装置
KR20130019589A (ko) 이동통신단말기의 콘텐츠 공유장치와 공유시스템 및 공유방법
CN101933309A (zh) 通信系统中为用户提供提示信息的方法和装置
JP2002135422A (ja) Ipネットワークを利用した会話方法および会話システム
KR101381312B1 (ko) 이동통신단말기를 이용한 통화중 콘텐츠 공유방법
CN116527955A (zh) 信息推送方法、装置
JP2023122145A (ja) 情報処理装置、情報処理方法、記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150205

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151021

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160112

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160510

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160602

R150 Certificate of patent or registration of utility model

Ref document number: 5947156

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250