JP2002215670A - 音声応答装置、音声応答方法、音声応答プログラム、音声応答プログラムを記録した記録媒体および予約システム - Google Patents

音声応答装置、音声応答方法、音声応答プログラム、音声応答プログラムを記録した記録媒体および予約システム

Info

Publication number
JP2002215670A
JP2002215670A JP2001006921A JP2001006921A JP2002215670A JP 2002215670 A JP2002215670 A JP 2002215670A JP 2001006921 A JP2001006921 A JP 2001006921A JP 2001006921 A JP2001006921 A JP 2001006921A JP 2002215670 A JP2002215670 A JP 2002215670A
Authority
JP
Japan
Prior art keywords
information
voice
user
search
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001006921A
Other languages
English (en)
Inventor
Koji Soma
宏司 相馬
Fumisada Yamazaki
文貞 山▲崎▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Omron Tateisi Electronics Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp, Omron Tateisi Electronics Co filed Critical Omron Corp
Priority to JP2001006921A priority Critical patent/JP2002215670A/ja
Publication of JP2002215670A publication Critical patent/JP2002215670A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Telephonic Communication Services (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 既存の設備を有効利用して、サービス提供者
の設備確立のための負担を軽減し、音声サービスの拡大
を図る。利用者の音声入力に基づく検索結果のうち、有
益な情報のみを利用者に提供する。 【解決手段】 IVR5を、予約情報を格納したデータ
ベースから情報の検索を行うWebサーバとインターネ
ットを介して接続することで予約システムを構築する。
上記のIVR5は、利用者によって入力された音声情報
に対応するデータを生成する音声認識部12およびWe
b入力用データ変換部13と、上記データをWebサー
バに送信する制御を行う制御部18と、上記データに基
づいてWebサーバが情報の検索を行い、その結果を受
信したときに、受信した検索結果から、利用者に有益な
検索結果のみを抽出する抽出部15と、抽出した上記検
索結果を音声に変換し、利用者に提供する読み上げ部1
6とを備えて構成される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、一般加入電話や携
帯電話にて利用者が発した音声を自動的に認識すると共
に、音声での要求に応じた情報を利用者に音声で提供す
る音声応答装置と、音声応答方法と、音声応答プログラ
ムと、音声応答プログラムを記録した記録媒体と、上記
音声応答装置を用いて各種チケット(航空券、列車の乗
車券、コンサートチケットなど)や通信販売における商
品などの予約を自動的に行う予約システムとに関するも
のである。
【0002】
【従来の技術】インターネットの普及により、上記各種
チケットや上記商品の予約をインターネットを介して行
うシステムが従来から提案されているが、最近では、さ
らに音声応答装置(Interactive Voice Response;以
下、IVRと略称する)を取り入れて、音声での予約サ
ービスを提供するシステムも提案されている。音声入力
の場合、誰でも簡単にかつ短時間で必要な情報を入力で
きるため、利用者の利便性が向上し、ひいては、各種チ
ケットや商品の販売促進を図ることができるからであ
る。図17は、このような従来の予約システムの概略の
構成を示している。
【0003】上記システムにおいて、例えばPC(Pers
onal Conputer )で構成される利用者側のインターネッ
ト端末51は、通信回線としてのインターネット52を
介して各種Webサーバ53と接続されている。なお、
インターネット端末51を携帯電話で構成した場合、イ
ンターネット端末51は、インターネット接続サービス
(i−mode(登録商標)など)においてゲートウェ
イ54を介して各種Webサーバ53と接続される。
【0004】任意のWebサーバ53は、例えば列車の
乗車券の予約状況(空席状況)をデータとして格納して
いるデータベース(以下、DBと略称する)55と接続
されており、インターネット端末51にてキー入力され
た情報(例えば、出発地、到着地、出発日、出発時刻)
に合致する列車の指定券の予約状況を、上記情報に基づ
いて検索し、DB55から抜き出す。なお、Webサー
バ53にて扱うデータは、HTML(Hyper Text Marku
p Language)形式である。Webサーバ53にて抜き出
した結果は、インターネット52を介してインターネッ
ト端末51に送信され、PCや携帯電話のモニタに表示
される。
【0005】一方、音声入力に用いられる電話(一般加
入電話や携帯電話)56は、IVR57と接続されてい
る。利用者が予約を希望する列車の情報(例えば、出発
地、到着地、出発日、出発時刻)を音声で電話56に入
力すると、IVR57は、上記音声情報を認識し、その
情報に合致する列車の指定券の予約状況をDB55から
抜き出す。そして、IVR57は、抜き出した結果を音
声情報に変換した後、利用者の電話56へ送信する。
【0006】結局、インターネット端末51を利用した
場合の情報のやりとりは、同図中、細線の矢印で示さ
れ、電話56を利用した場合の情報のやりとりは、太線
の矢印で示される。また、Webサーバ53とDB55
とIVR57とで、予約サービスを提供する側のシステ
ムが社内設備として構築される。
【0007】
【発明が解決しようとする課題】ところが、図17に示
した従来の予約システムでは、DB55との間で情報の
やりとりを行うためのインターフェース部分をIVR5
7に設ける必要がある。特に、DBとしては、列車の予
約状況を格納した上記のDB55のほかに、提供するサ
ービスの形態に応じた情報(例えば航空機の予約状況)
を格納したDB、顧客の住所、氏名、電話番号、クレジ
ットカード番号などの顧客情報を格納したDBなども存
在する。なお、顧客情報を格納したDBは、本システム
により予約を行った後、課金決済処理を行う際に利用さ
れるものである。したがって、IVR57は、複数のD
Bとアクセスする必要が生じるため、IVR57に各々
のDBに対応したインターフェース部分を設けることが
必要となる。
【0008】しかし、DBによってインターフェースの
仕様はまちまちであるため、上記システムでは、各イン
ターフェース部分の開発に手間がかかる。また、各DB
の仕様が変更になった場合、Webサーバ53のインタ
ーフェース部分およびIVR57のインターフェース部
分も修正が必要となる。このような問題は、予約システ
ムにおける音声サービスを付加サービスとして広げるこ
とを阻む要因となっていた。
【0009】一方、HTMLの代わりにVXML(Voic
e eXtensible Markup Language)という新しい方式を用
いて、上記と同様のサービスを実現することも可能であ
る。この場合、Webサーバ53を、図18に示すよう
に、VXMLに対応したVoice−Webサーバ61
に変更し、Voice−Webブラウザ62を音声ブラ
ウザとして使用することによって、インターネット用の
サービスと音声サービスとを両方実現することが可能と
なる。
【0010】しかし、VXMLを使用する場合は、VX
MLに対応するように、上記のようにWebサーバ53
のVoice−Webサーバ61への変更(HTMLの
書き換え)を余儀なくされ、既存のWebサーバ53を
有効活用することができない。
【0011】また、従来の予約システムでは、以下のよ
うな問題も生ずる。
【0012】利用者が列車の座席の予約を音声入力で行
うにあたり、利用者が列車の時刻表を把握できていない
場合には、例えば『13時ごろ発、大阪から京都まで』
のように、出発地、到着地を明確に指定しても、出発時
刻を明確に指定しない場合がある。この場合、Webサ
ーバ53によるDB55からの情報の検索は、出発時刻
が13時付近の列車(例えば、出発時刻が12時30分
から13時30分の間にある列車)を対象にして行われ
ることとなる。
【0013】このとき、利用者の希望に合う列車が、1
2時30分発から13時10分発まで10分おきに計7
本見つかったとする。しかも、12時30分発から13
時10分発までの5本の列車は、いずれも満席であった
とする。この場合、従来の予約システムでは、IVR5
7が、『12時30分、大阪発京都着の列車は満席で
す』、『12時40分、大阪発京都着の列車は満席で
す』、…『13時10分、大阪発京都着の列車は満席で
す』、『13時20分、大阪発京都着の列車は空席があ
ります』、『13時30分、大阪発京都着の列車は空席
があります』、というように、検索結果を最初から順番
に利用者に提供するようになっている。つまり、利用者
は空席のある列車の予約をとりたいにもかかわらず、そ
のような列車の予約状況と併せて、利用者にとって不要
な、既に満席となっている列車の予約状況までもが利用
者に提供されることとなっている。そのため、従来の予
約システムは、不要な情報も含めて最初から音声情報を
聞かなければならない利用者に一種の煩わしさを与える
ものとなっていた。
【0014】本発明は、上記の問題点を解決するために
なされたもので、その目的は、既存の設備を有効利用し
て、サービス提供者の設備確立のための負担を軽減し、
これによって音声サービスをより充実させることができ
ると共に、利用者の音声入力に基づく検索結果のうち、
有益な情報のみを利用者に提供することができる音声応
答装置、音声応答方法、音声応答プログラム、音声応答
プログラムを記録した記録媒体および予約システムを提
供することにある。
【0015】
【課題を解決するための手段】本発明に係る音声応答装
置(以下、IVRとも記載する)は、上記の課題を解決
するために、情報を格納したデータベースから情報の検
索を行う検索サーバと通信回線を介して接続された音声
応答装置であって、利用者によって入力された音声情報
に対応するデータを生成するデータ生成手段と、上記デ
ータを上記検索サーバに送信する制御を行う制御手段
と、上記データに基づいて上記検索サーバが情報の検索
を行い、その結果を受信したときに、受信した検索結果
から、利用者への提供が不要な検索結果を削除して残り
の検索結果を抽出する情報抽出手段と、抽出した上記検
索結果を音声に変換し、利用者に提供する情報提供手段
とを備えていることを特徴としている。
【0016】また、本発明に係る音声応答方法は、上記
の課題を解決するために、利用者によって入力された音
声情報に対応するデータを(データ生成手段が)生成す
るステップと、(制御手段の制御により、)上記データ
を、情報を格納したデータベースから情報の検索を行う
検索サーバに通信回線を介して送信するステップと、
(情報抽出手段が、)上記データに基づいて上記検索サ
ーバが情報の検索を行い、その結果を受信したときに、
受信した検索結果から、利用者への提供が不要な検索結
果を削除して残りの検索結果を抽出するステップと、
(情報提供手段が、)抽出した上記検索結果を音声に変
換し、利用者に提供するステップとを有していることを
特徴としている。
【0017】上記の構成によれば、IVRは、通信回線
(例えばインターネット)を介して検索サーバと接続さ
れるように構成されている。このような接続方式で情報
の検索を行うシステムを構成する場合、データベースに
直接アクセスするのはIVRではなく検索サーバとなる
ので、データベースが複数存在し、各データベースの仕
様が異なっていても、そのような仕様に関係なく、IV
R(特にインターフェース部分)を構成することがで
き、また、各データベースの仕様が変更になった場合で
も、引き続き、既存のIVRを使用することができる。
【0018】また、例えばVXMLに対応する特殊なW
ebブラウザを用いなくても、既存のIVRで上記シス
テムを構成できることから、VXMLに対応するように
検索サーバを変更しなくても済み、既存の検索サーバを
使用することができる。
【0019】このように、上記接続方式を採用すること
で、既存の設備を有効利用してシステムを構築すること
ができる。これにより、音声サービスを提供する提供者
側の設備確立のための負担が軽減されるので、サービス
提供者は、音声サービスの設備充実を容易に図ることが
でき、より充実した音声サービスを利用者に提供して音
声サービスを広げることが可能となる。
【0020】また、データ生成手段によって生成され
る、利用者からの音声情報に対応するデータが、制御手
段の制御により、検索サーバに送信されると、検索サー
バでは、上記データに基づいて上記データベースからの
情報の検索が行われる。そして、その検索結果は、検索
サーバからIVRへ送信される。
【0021】ここで、上記構成では、情報抽出手段が、
受信した検索結果から、利用者への提供が不要な検索結
果を削除して残りの検索結果を抽出する。例えば、シス
テムが列車の予約状況を検索し、その検索結果を提供す
るものである場合、利用者への提供が不要な検索結果と
は、それを聞いても予約が不可能な満席の列車の情報で
あり、残りの検索結果とは、予約が可能な空席の列車の
情報を想定することができる。抽出された検索結果は、
情報提供手段により音声に変換されて利用者に提供され
る。
【0022】このように、検索結果のうち、利用者にと
って有益なものだけが利用者に提供されるので、不必要
な情報を聞く場合のような不快感を利用者が味わうこと
がない。
【0023】また、本発明に係る音声応答プログラム
は、上記の課題を解決するために、上記した音声応答方
法による処理をコンピュータに実行させるためのプログ
ラムであることを特徴としている。すなわち、本発明に
係る音声応答プログラムは、利用者によって入力された
音声情報に対応するデータを生成する処理と、上記デー
タを、情報を格納したデータベースから情報の検索を行
う検索サーバに通信回線を介して送信する処理と、上記
データに基づいて上記検索サーバが情報の検索を行い、
その結果を受信したときに、受信した検索結果から、利
用者への提供が不要な検索結果を削除して残りの検索結
果を抽出する処理と、抽出した上記検索結果を音声に変
換し、利用者に提供する処理とをコンピュータに実行さ
せるためのプログラムであることを特徴としている。
【0024】上記の音声応答プログラムをコンピュータ
が実行することにより、本発明の音声応答方法を実現す
ることが可能となる。この音声応答プログラムは、コン
ピュータにて読み取り可能な記録媒体に記録されてい
る。
【0025】本発明に係る音声応答装置は、上記の課題
を解決するために、上記データ生成手段が生成するデー
タは、上記検索サーバで扱う形式のデータであることを
特徴としている。
【0026】上記の構成によれば、利用者によって入力
された音声情報は、データ生成手段によって、上記検索
サーバで扱う形式のデータに変換される。これにより、
上記データは、検索サーバへの入力に適合したものとな
り、上記音声情報に則して検索サーバを確実に動作させ
ることができる。
【0027】本発明に係る音声応答装置は、上記の課題
を解決するために、上記情報抽出手段は、上記検索サー
バが上記データに基づいて情報の検索を行った結果とし
て複数の検索結果を受信したときに、個々の検索結果を
その種類ごとに複数桁からなるフラグの各桁およびその
数字に対応させると共に、個々の検索結果の利用者への
提供の必要性を、上記フラグの各桁の数字に基づいて判
断し、上記情報提供手段は、上記情報抽出手段での判断
結果に応じて、検索結果をフラグの各桁およびその数字
に対応する音声に変換することを特徴としている。
【0028】上記の構成によれば、検索サーバから受信
した個々の検索結果が、情報抽出手段によって、その種
類ごとにフラグの各桁およびその数字に対応させられ
る。
【0029】例えば、検索サーバが列車の乗車券の予約
状況の検索を行い、その結果、普通車・禁煙席、普通車
・喫煙席、グリーン車・禁煙席、グリーン車・喫煙席の
4種類の座席についての検索結果がIVRに送信された
とする。この場合、情報抽出手段は、例えば4桁のフラ
グ“ABCD”を利用し、各桁を上記4種類の座席の予
約状況に対応付ける。そして、所定の座席が満席であれ
ば、上記座席に対応する桁の数字を例えば“0”に、空
席があれば、対応する桁の数字を例えば“1”にする。
【0030】このような対応付けにより、例えばA=0
であれば、普通車・禁煙席は満席であるので、情報抽出
手段は、この座席については予約不可能で、検索結果を
利用者へ提供する必要がないと判断する。一方、例えば
C=1であれば、グリーン車・禁煙席は空席があるの
で、情報抽出手段は、この座席の検索結果については利
用者へ提供する必要があると判断する。このようにし
て、利用者に提供されるべき検索結果の抽出が行われ
る。
【0031】そして、情報提供手段は、情報抽出手段で
の判断結果に応じて、検索結果をフラグの各桁およびそ
の数字に対応する音声に変換する。例えば、C=1の場
合には、検索結果を利用者に提供する必要があるとの情
報抽出手段での判断結果に応じて、『グリーン車・禁煙
席は空席があります。』などの音声メッセージが、情報
提供手段にて生成される。
【0032】このように、個々の検索結果を、その種類
ごとにフラグの各桁およびその数字に対応させること
で、最終的に、利用者は、個々の検索結果を、その種類
ごと(上記の例では4種類の座席ごと)に把握すること
ができる。また、情報提供手段は、情報抽出手段での判
断結果に応じて音声変換するので、上記判断結果が、利
用者への検索結果の提供が不要であると出た場合は、そ
のような不要な検索結果の音声変換は中止され、その検
索結果が利用者に提供されることはない。
【0033】本発明に係る音声応答装置は、上記の課題
を解決するために、検索結果の種類に対応する記号情報
を認識するための記号認識テーブルを格納している記号
認識テーブル格納手段をさらに備え、上記情報抽出手段
は、上記検索サーバが上記データに基づいて情報の検索
を行った結果として複数の検索結果を上記記号情報と対
応付けて受信したときに、抽出した検索結果に対応する
記号情報を、上記記号認識テーブルに基づいて認識し、
上記情報提供手段は、抽出した上記検索結果を上記認識
結果に対応する音声に変換することを特徴としている。
【0034】上記の構成によれば、検索サーバからの複
数の検索結果は、記号情報と対応付けられている。上記
記号情報は、検索結果の種類に対応しており、検索サー
バによる情報の検索が、例えば列車の予約状況を目的と
するものであれば、普通車、グリーン車、禁煙席、喫煙
席を示す記号の情報(例えばgif 形式のデータ)を想定
することができる。
【0035】ここで、上記記号情報を受信しても、個々
の記号情報とその内容との対応関係がわかっていない
と、利用者に提供すべく抽出した検索結果が、普通車、
グリーン車、禁煙席、喫煙席のいずれについてのものか
が不明であり、検索結果を座席の種類を特定して利用者
に提供することはできない。
【0036】そこで、上記構成では、記号情報を認識す
るための記号認識テーブルを格納した記号認識テーブル
格納手段が設けられており、情報抽出手段は、抽出した
検索結果に対応する記号情報を、上記記号認識テーブル
に基づいて認識するので、検索結果がどの記号情報の内
容(座席の種類)と対応しているかを認識することがで
きる。したがって、情報提供手段が、情報抽出手段にて
抽出した検索結果を情報抽出手段での認識結果に対応す
る音声に変換することで、検索結果をその種類ごとに適
切に利用者に音声で提供することができる。
【0037】本発明に係る予約システムは、上記の課題
を解決するために、上述した音声応答装置と、予約情報
を格納したデータベースと、上記音声応答装置からのデ
ータを通信回線を介して受信し、受信したデータに基づ
いて、上記データベースから予約情報の検索を行い、そ
の検索結果を上記音声応答装置に送信した後、予約処理
を行う検索サーバとを備えてなることを特徴としてい
る。
【0038】上記の構成によれば、上述したIVRを、
データベースを検索する検索サーバと通信回線を介して
接続することで、既存の設備を有効利用した予約システ
ムを構築することができる。これにより、サービス提供
者側の設備確立のための負担が軽減され、サービス提供
者が予約システムの設備充実を容易に図ることができ
る。その結果、より充実した音声予約サービスを利用者
に提供することができる。
【0039】また、本発明のIVRを用いることで、利
用者に不要な検索結果(予約状況)が提供されることは
ないので、音声予約サービスの利用者に不快感を与える
ことはない。
【0040】
【発明の実施の形態】本発明の実施の一形態について、
図面に基づいて説明すれば以下の通りである。
【0041】本発明は、音声応答装置であるIVRを用
いて、例えば航空券、列車の乗車券、コンサートチケッ
トなどの各種チケットや、通信販売で扱う商品の予約サ
ービスを利用者に提供するにあたり、予約処理を実行
するWebサーバとIVRとを通信可能に接続し、か
つ、Webサーバからの予約情報のうち、利用者に有
益な情報だけを利用者に提供できるようにIVRを構成
した点、に大きな特徴がある。そこで、以下に、まず、
予約システムのシステム構成およびIVRの構成につい
て説明し、その後、予約システム全体のおける処理につ
いて説明することにする。
【0042】(1.システム構成)図2は、本発明にお
ける予約システムの概略の構成を示している。本予約シ
ステムは、インターネット端末1と、Webサーバ2
(検索サーバ)と、DB3と、音声入力用の電話4と、
IVR5とを含んで構成されている。そして、Webサ
ーバ2とDB3とIVR5とで、予約サービスを提供す
る側のシステムが社内設備として構築されている。
【0043】インターネット端末1は、利用者側で用い
られるものであり、例えばPCや携帯電話で構成され
る。インターネット端末1は、PCで構成される場合、
通信回線としてのインターネット6を介してWebサー
バ2と接続され、携帯電話で構成される場合、インター
ネット接続サービス(i−mode(登録商標)など)
においてゲートウェイ7を介してWebサーバ2と接続
されている。インターネット端末1において、PCのキ
ーボードやマウス、あるいは携帯電話の入力ボタンによ
り利用者が入力した情報は、インターネット6を介して
Webサーバ2に送信される。
【0044】Webサーバ2は、インターネット端末1
からキー入力された情報、もしくは、IVR5からイン
ターネット6を介して送信される情報に基づいて、DB
3に格納されている予約情報を検索する検索サーバであ
り、インターネット端末1またはIVR5にその結果を
送信する。また、Webサーバ2は、インターネット端
末1やIVR5から返信される情報に基づいて、上記し
た各種チケットや商品の予約処理を行うようにもなって
いる。
【0045】なお、Webサーバ2は、提供するサービ
スに応じて複数設けられるものであるが、図2では、本
予約システムに関係するものとしてWebサーバ2を1
個だけ図示している。また、Webサーバ2で扱うデー
タは、HTML形式であり、Webサーバ2は、HTM
L形式のテキストデータをインターネット端末1または
IVR5に送信するようになっている。
【0046】DB3は、サービス提供者が提供する予約
サービスの内容に応じた情報を格納しているデータベー
スである。つまり、DB3は、上記各種チケットや上記
商品の予約状況などをデータとして格納している。した
がって、DB3は、上記サービスの内容に応じて、通
常、複数設けられているが、図2では、例えば列車の乗
車券の予約状況をデータとして格納するものとして、D
B3を1個だけ図示している。DB3に格納されたデー
タは、Webサーバ2により、チケットや商品の予約に
応じて適宜更新されるようになっている。
【0047】また、図示していないが、顧客の住所、氏
名、電話番号、クレジットカード番号などの顧客情報を
格納したDBも存在しており、本システムを利用して利
用者が列車の予約を行った後は、Webサーバ2が上記
DBにアクセスし、上記顧客情報に基づいて課金決済処
理が行われるようになっている。
【0048】電話4は、音声入力可能な例えば一般加入
電話や携帯電話で構成されており、IVR5と音声で通
信することが可能となっている。
【0049】IVR5は、電話4から入力された音声情
報を認識し、認識した音声情報をWebサーバ2で扱う
テキストデータ(テキスト情報)に変換し、インターネ
ット6を介してWebサーバ2に送信するものである。
また、IVR5は、逆に、Webサーバ2からテキスト
形式で送信される予約情報を音声情報に変換し、電話4
に出力するようにもなっている。IVR5のより具体的
な構成は以下の通りである。
【0050】(2.IVRの構成)IVR5は、上述の
ように、予約情報を格納したデータベース(DB3)か
ら情報の検索を行う検索サーバ(Webサーバ2)と通
信回線(インターネット6)を介して接続された音声応
答装置である。IVR5は、図1に示すように、音声入
出力部11と、音声認識部12(データ生成手段)と、
Web入力用データ変換部13(データ生成手段)と、
データ送受信部14と、抽出部15(情報抽出手段)
と、読み上げ部16(情報提供手段)と、記号/音声対
応DB17(記号認識テーブル格納手段)と、制御部1
8(制御手段)と、記憶部19(記憶手段)とを含んで
構成されている。
【0051】音声入出力部11は、電話4との間で音声
情報をやりとりするためのインターフェースを司ってい
る。つまり、音声入出力部11には、電話4からの音声
情報が入力され、また、音声入出力部11からは、We
bサーバ2からのテキストデータに基づいてIVR5内
で生成された音声情報が電話4へ出力される。
【0052】音声認識部12は、電話4から音声入出力
部11を介して入力された音声情報を、後述のようにし
て認識し、認識した音声情報をテキストデータに変換す
るものである。
【0053】Web入力用データ変換部13は、音声認
識部12での音声認識結果(テキストデータ)を、We
bサーバ2への入力に適合するようなデータに変換する
ものである。Webサーバ2では、通常、使える文字の
制限などがあるため、音声認識部12にて得られたテキ
ストデータがそのまま使えない場合がある。そのため、
Web入力用データ変換部13が上記のようなデータ変
換処理を行うのである。
【0054】なお、Webサーバ2への入力に適合する
テキストデータが得られるように、上記音声情報を上記
テキストデータに変換する音声認識部12を構成した場
合は、Web入力用データ変換部13を不要とすること
ができる。
【0055】つまり、音声認識部12とWeb入力用デ
ータ変換部13とで、電話4から音声入出力部11を介
して入力された音声情報を、Webサーバ2に適合する
テキストデータに変換する音声情報変換手段が構成され
ている。また、音声認識部12とWeb入力用データ変
換部13とで、利用者によって入力された音声情報に対
応するデータを生成するデータ生成手段が構成されてい
るとも言うことができる。上記データ生成手段が生成す
る上記データは、Webサーバ2で扱う形式のデータで
ある。
【0056】データ送受信部14は、制御部18の制御
に基づいて、音声認識部12またはWeb入力用データ
変換部13からのテキストデータをWebサーバ2に送
信し、また、上記テキストデータに基づいてWebサー
バ2が情報の検索を行った結果をテキストデータとして
受信するためのインターフェースである。
【0057】抽出部15は、Webサーバ2から受信し
た検索結果から、利用者への提供が不要な検索結果(第
1の検索結果)を削除して残りの検索結果(利用者に有
益な第2の検索結果)を抽出するものである。第1の検
索結果と第2の検索結果とは、例えばフラグという概念
を用いることで区別可能であるが、その詳細については
後述する。
【0058】読み上げ部16は、抽出部15にて抽出し
た検索結果(第2の検索結果)を音声に変換し、利用者
に提供するものである。
【0059】記号/音声対応DB17は、Webサーバ
2から送信される検索結果の中に記号が含まれている場
合に、上記記号を認識するための記号認識テーブルを格
納しているデータベースである。上記記号としては、例
えば、列車の予約であれば、普通車やグリーン車、禁煙
席や喫煙席を示す記号を想定することができる。Web
サーバ2から送信される検索結果の中に記号が含まれて
いる場合、この記号認識テーブルを利用すれば、上記の
ようなフラグの概念を用いなくても、そのような記号を
区別して、各記号に対応する音声を出力することが可能
となる。記号認識テーブルを利用する場合の音声化処理
についても後述する。
【0060】制御部18は、例えばCPU(Central Pr
ocessing Unit )で構成され、IVR5全体(IVR5
の各処理部)の動作を制御するものである。
【0061】記憶部19は、例えばRAM(Random Acc
ess Memory)、ROM(Read OnlyMemory)、ハードデ
ィスクなどで構成され、上述の各処理部を動作させるた
めのプログラムを格納したり、各処理部にて処理した結
果や、電話4に音声出力する際の各種メッセージをデー
タとして記憶している。
【0062】なお、図示していないが、IVR5は、さ
らに、フロッピー(登録商標)ディスクやCD−ROM
といった記録媒体を駆動し、この記録媒体に対して情報
を記録または再生するドライブを備えている。
【0063】(3.予約システムでの処理)次に、本発
明の予約システムでの処理について説明する。なお、こ
こでは、DB3が、列車の乗車券の予約状況をデータと
して格納しており、利用者が所望の列車の乗車券を予約
する場合について説明する。また、Webサーバ2は、
例えば図3に示すようなページ、すなわち、出発駅、到
着駅、出発時間、入力完了を入力できるページを画面ベ
ースで有しており、インターネット端末1の表示画面に
は、これと同じ画面が表示されるものとする。
【0064】(3−1.インターネット端末を利用する
場合)利用者が、インターネット端末1にて、出発駅、
到着駅、出発時間をキー入力し、最後に入力完了ボタン
をクリックすると、これらの情報がWebサーバ2に送
信される。そして、Webサーバ2では、上記入力情報
に合致する列車の乗車券の予約状況を、上記入力情報に
基づいて検索し、DB3から抜き出す。
【0065】ここで、Webサーバ2は、DB3から抜
き出した結果に基づき、利用者の予約が可能であると判
断した場合、その旨をテキストデータでインターネット
端末1に送信し、予約の確認をとる。Webサーバ2
は、この確認に後に予約処理を行い、この結果、予約が
完了した場合には、例えば図4(a)に示すような画面
がインターネット端末1のモニタに表示される。
【0066】一方、Webサーバ2は、DB3から抜き
出した結果に基づき、利用者の予約が不可能である(既
に満席である)と判断した場合、その旨をテキストデー
タでインターネット端末1に送信する。この結果、例え
ば図4(b)に示すような画面がインターネット端末1
のモニタに表示される。
【0067】このようなインターネット端末1とWeb
サーバ2とのやりとりは、一般的なWebブラウザとW
ebサーバとのやりとりであるが、これを上述した画面
ベースではなく、テキストベースで行うと、ブラウザ無
しでやりとりすることができる。なお、この点について
は、例えばオーム社発売、オラインリー・ジャパン発行
の「Webクライアントプログラミング」で紹介されて
いる。
【0068】(3−2.音声入力用の電話を利用する場
合)まず、その大まかな流れを図5のフローチャートに
基づいて説明する。
【0069】利用者が電話4にてIVR5にアクセスす
ると、IVR5は、Webサーバ2のレスポンス状況を
確認する(ステップ1;以下、ステップは単にSと略記
する)。これは、IVR5とWebサーバ2とは、通
常、通信を行っていないため、利用者からのコールがか
かってきたときに、Webサーバ2が生きていることを
確認する必要があるためである。
【0070】続いて、IVR5と電話4(利用者、話者
(caller))との間で、各種情報のやりとりが行われる
(S2)。IVR5は、S1にてWebサーバ2が生き
ていることを確認すると、Webサーバ2に送信(ポス
ト)するデータを利用者からまとめて取得していくこと
になる。
【0071】そして、IVR5は、S2にて取得したデ
ータをWebサーバ2に送信し、その結果を利用者に提
示して確認をとる(S3)。つまり、このS3では、利
用者、IVR5、Webサーバ2間で、データの確認の
やりとりが行われる。
【0072】結局、図2において、インターネット端末
1を利用した場合の情報のやりとりは、同図中、細線の
矢印で示され、電話4を利用した場合の情報のやりとり
は、太線の矢印で示される。
【0073】(3−2−1.音声入力に基づく処理の詳
細)次に、音声入力に基づく処理の詳細について、図6
のフローチャートに基づいて説明する。
【0074】まず、利用者が電話4にてIVR5にアク
セスすると(S11)、IVR5の制御部18は、イン
ターネット6を介しての接続をWebサーバ2に要求す
る(S12)。Webサーバ2が、上記接続要求を受け
て、上記IVR5と接続可能であることを応答すると
(S13)、IVR5は、制御部18の制御によって、
『乗車券予約システムです。出発駅、到着駅、出発時間
をおっしゃって下さい。』のようなメッセージを音声入
出力部11を介して電話4に出力する(S14)。な
お、このS12およびS13が、図5のS1に対応して
いる。
【0075】続いて、利用者は、S14でのメッセージ
にしたがい、例えば『3時30分ごろ発、東京から新大
阪まで。』というように、出発駅、到着駅、出発時間を
電話4にて発話する(S15)。すると、発話された音
声情報は、IVR5の音声入出力部11を介して音声認
識部12に入力されてそこで認識され、その認識結果の
確認として、例えば『東京駅3時30分ごろ発の「のぞ
み」で新大阪駅までで検索します。』というメッセージ
を、制御部18の制御によって、音声入出力部11を介
して電話4に出力する(S16)。利用者は、このメッ
セージを聞いて、『はい、そうです。』のような確認メ
ッセージを発話する(S17)。なお、上記S15〜S
17までが、図5のS2に対応している。
【0076】上記確認メッセージをIVR5が受ける
と、音声認識部12では、認識した上記音声情報がテキ
ストデータに変換され、さらに、Web入力用データ変
換部13にてWebサーバ2に対応する形式に変換され
た後、変換後のテキストデータがデータ送受信部14を
介してWebサーバ2に送信される(S18)。Web
サーバ2では、送信された内容で空席確認(DB3から
の検索)を行い、その結果(レスポンス)を予約情報と
してIVR5に送信する(S19)。
【0077】なお、利用者が列車の予約をとりたい場
合、利用者が予約希望の時間に出発する列車が満席であ
っても、それに近い出発時間、あるいは、それ以降の出
発時間の列車に空席があれば、利用者はその予約を希望
するのがほとんどである。そこで、Webサーバ2は、
利用者が入力した情報に合致する列車のみならず、例え
ば利用者が入力した出発時間以降の列車の予約状況も検
索し、検索結果をIVR5(またはインターネット端末
1)に送信するようになっている。
【0078】上記レスポンスを受けたIVR5では、抽
出部15が、必要に応じて記号/音声対応DB17の記
号認識テーブルを用いて、上記レスポンスを音声情報に
変換し、読み上げ部16が例えば『○時○○発の「のぞ
み」は、空席があります。△時△△分発の「のぞみ」
は、空席は残り少ないです。×時××分発の「のぞみ」
は、…。』のように上記音声情報を読み上げて電話4に
出力する(S20)。
【0079】なお、本予約システムでは、読み上げる音
声情報の中に、利用者に不要な情報(例えば満席となっ
ている列車の情報)が含まれている場合に、そのような
音声情報を削除した情報のみが利用者に提供されるが、
この点については後述する。
【0080】上記音声情報が、予約可能な列車の情報を
複数含んでいる場合には、上記音声情報を聞いた利用者
は、例えば『○時○○発の「のぞみ」というように発話
し、予約希望の列車を選択する(S21)。一方、上記
音声情報が、予約可能な列車1台の情報である場合に
は、利用者はその列車の予約でよいか否かを発話する。
【0081】S21にて選択もしくは了承された、予約
希望の列車の情報が、IVR5からWebサーバ2に送
信されると(S22)、Webサーバ2は、送信された
内容で列車の予約を完了させると共に、その結果をIV
R5に送信する(S23)。なお、Webサーバ2が予
約を完了させる前に、IVR5は予約列車の確認メッセ
ージを電話4に出力し、利用者の発話した列車の予約で
よいか否かの確認をとるようにしてもよい。
【0082】S23により、Webサーバ2からのレス
ポンスを受信したIVR5は、上記レスポンスを音声情
報に変換し、例えば『○時○○発の「のぞみ」で東京か
ら新大阪まで予約しました。ご利用ありがとうございま
した。』のメッセージを音声で電話4に出力する(S2
4)。利用者は、上記メッセージの内容を確認し、電話
4を切ることになる(S25)。なお、S18〜S25
までが、図5のS3に対応している。
【0083】(3−2−2.IVRでの処理)次に、上
記した予約システムにおけるIVR5での処理を、図7
のフローチャートに基づいてさらに詳細に説明する。
【0084】まず、利用者からのアクセスに応じて、I
VR5の制御部18がWebサーバ2へ接続要求を行う
と(S31)、制御部18は、Webサーバ2からの応
答が所定時間内にあったか否かを判断する(S32)。
S32にて、所定時間内に応答がない場合には、制御部
18の制御により、『申し訳ありません。只今お取り扱
いできません。』のような取扱不可能メッセージが電話
4に出力される(S33)。
【0085】一方、S32にて、所定時間内に応答があ
った場合には、制御部18の制御により、『出発駅、到
着駅、出発時間をおっしゃって下さい。』のようなメッ
セージが音声で電話4に出力され、出発駅、到着駅、出
発時間の発話が促される(S34)。
【0086】上記メッセージにしたがい、利用者が予約
を希望する列車の出発駅、到着駅、出発時間を発話する
と、IVR5の音声認識部12は、それらの音声情報を
後述する手法で認識する(S35)。そして、制御部1
8での制御により、例えば『出発駅は○○駅、到着駅は
△△駅、出発時間は×時××分で宜しいですか。』のよ
うなメッセージが音声で電話4に出力され、認識結果の
確認が行われる(S36)。
【0087】次に、音声認識部12は、S36での確認
メッセージに対する応答が、上記認識結果が正しい(適
切な)場合に対応する『はい』であるか、間違っている
(不適切な)場合に対応する『いいえ』であるかを認識
する(S37)。そして、制御部18は、S37での認
識に基づいて、出発駅、到着駅、出発時間の認識結果の
適否を判断する(S38)。S38にて、上記認識結果
が不適切な場合は、再認識処理に移行する(S39)。
なお、この再認識処理の詳細については後述する。
【0088】一方、S38にて、上記認識結果が適切な
場合は、IVR5は、制御部18の制御により、上記認
識結果(音声情報)をWebサーバ2に対応するように
テキストデータに変換する(S40)。なお、上記テキ
ストデータへの変換は、上述したように音声認識部12
単独で行うこともできるし、音声認識部12とWeb入
力用データ変換部13との併用で行うこともできる。
【0089】上記認識結果に対応する上記テキストデー
タは、制御部18の制御により、データ送受信部14を
介してWebサーバ2に送信される(S41)。これに
より、Webサーバ2は、上記テキストデータに基づい
てDB3に格納されたデータ(予約状況)の検索を行う
ことになる。Webサーバ2での検索結果は、予約状況
を示す予約情報としてテキストデータでIVR5に送信
される。
【0090】IVR5は、Webサーバ2から検索結果
を受信すると(S42)、抽出部15にて、検索結果の
うち利用者に有益な情報の音声化処理が行われる(S4
3)。なお、この音声化処理の詳細については後述す
る。そして、読み上げ部16によって、例えば『○○駅
から○○駅までの○時○○分発の列車は、…。この列車
を予約しますか』のような、検索結果の確認をとるため
のメッセージが音声で電話4に出力される(S44)。
【0091】このメッセージにしたがい、利用者が予約
対象の列車を選択もしくは了承する返事を音声でIVR
5に入力すると、音声認識部12は、予約対象の列車を
認識する(S45)。そして、制御部18の制御によ
り、例えば『○○駅から○○駅までの○時○○分発の列
車の予約ですね。』というような予約列車の確認メッセ
ージが電話4に音声で出力される(S46)。
【0092】続いて、音声認識部12は、S46での確
認メッセージの再生に基づく利用者の返事が、上記列車
の予約が適切な場合に対応する『はい』であるか、上記
列車の予約が不適切な場合に対応する『いいえ』である
かを認識する(S47)。そして、制御部18は、S4
7での認識に基づいて、予約の実行の適否を判断する
(S48)。S48にて、予約が不適切と判断した場合
には、S39の再認識処理に移行する。
【0093】一方、S48にて、予約が適切と判断した
場合には、制御部18は、データ送受信部14を介して
Webサーバ2へ予約列車番号を送信し、該当する列車
の予約をWebサーバ2に促す(S49)。そして、W
ebサーバ2が上記列車の予約を完了させ、IVR5
が、Webサーバ2から予約完了のレスポンスを受信す
ると(S50)、IVR5では、予約完了の確認メッセ
ージが再生される(S51)。つまり、IVR5は、W
ebサーバ2からの上記レスポンスを音声情報に変換
し、電話4に出力する。
【0094】(3−2−3.再認識処理)次に、図7の
S39における再認識処理について、図8のフローチャ
ートに基づいて説明する。
【0095】まず、図7のS38にて、出発駅、到着
駅、出発時間の認識結果が不適切であると判断された場
合、制御部18の制御により、例えば『出発駅○○、到
着駅××は正しいでしょうか』というメッセージが電話
4に出力され、出発駅および到着駅の確認が行われる
(S61)。利用者が、上記メッセージを受けて、出発
駅および到着駅の認識が適切な場合には『はい』を、認
識が不適切な場合には『いいえ』を発話すると、音声認
識部12は、そのような『はい』と『いいえ』とを認識
し(S62)、制御部18が利用者の返事が『はい』で
あるか否かを判断する(S63)。
【0096】S63にて、利用者の返事が『はい』であ
った場合には、制御部18の制御により、例えば『出発
時間を○時○○分のようにおっしゃって下さい。』のよ
うなメッセージが電話4に出力され、利用者による出発
時間の再発話が促される(S64)。
【0097】なお、S63からS64に移行するのは、
図7のS35での認識結果が、出発駅、到着駅、出発時
間のうち、出発駅および到着駅については適切であり、
出発時間についてのみ不適切であった場合と確定するた
め、S64の前に、例えば『出発時間は○時○○分で正
しいでしょうか』という確認メッセージを出力する必要
がない。そのため、S64でいきなり出発時間の発話を
利用者に促している。
【0098】S64にて利用者が発した出発時間を音声
認識部12が認識すると(S65)、制御部18の制御
により、例えば『出発時間は○時○○分で宜しいです
か』というメッセージが電話4に出力され、出発時間の
確認が行われる(S66)。利用者が、上記メッセージ
を受けて、出発時間が適切な場合には『はい』を、不適
切な場合には『いいえ』を発話すると、音声認識部12
は、そのような『はい』と『いいえ』とを認識し(S6
7)、制御部18が利用者の返事が『はい』であるか否
かを判断する(S68)。
【0099】S68にて、利用者の返事が『はい』であ
った場合には、出発駅、到着駅、出発時間が全て適切で
あることが確定するので、図7のS40に移行すること
になる。また、S68にて、利用者の返事が『いいえ』
であった場合には、S64に戻り、出発時間が再度確認
されることになる。
【0100】一方、S63にて、利用者の返事が『いい
え』であり、出発駅および到着駅の認識が不適切であっ
た場合には、制御部18の制御により、例えば『出発駅
は○○で宜しいですか』のようなメッセージが電話4に
出力され、まず、出発駅の確認が行われる(S69)。
【0101】利用者が、上記メッセージを受けて、出発
駅が適切な場合には『はい』を、不適切な場合には『い
いえ』を発話すると、音声認識部12は、そのような
『はい』と『いいえ』とを認識し(S70)、制御部1
8が利用者の返事が『はい』であるか否かを判断する
(S71)。
【0102】S71にて、利用者の返事が『いいえ』で
あった場合には、制御部18の制御により、例えば『出
発駅をおっしゃって下さい。』のようなメッセージが電
話4に出力され、利用者による出発駅の再発話が促され
る(S72)。そして、S72にて利用者が発した出発
駅を音声認識部12が認識すると(S73)、S69に
戻り、再発話された出発駅の確認が行われることにな
る。このような利用者による出発駅の再発話により、出
発駅の誤認識が正されることになる。
【0103】一方、S71にて、利用者の返事が『は
い』であった場合には、制御部18は、上記したS72
を通過したか否かを判断する(S74)。ここで、S6
9の出発駅の確認を行う場合は、S63で、出発駅およ
び到着駅の少なくとも一方の認識が不適切な場合である
ため、その後、S71にて、利用者の返事が『はい』で
ある場合(S72を通過していない場合)には、この時
点で、出発駅が適切で、到着駅が不適切であったことが
確定する。したがって、S72を通過していない場合に
は、例えば『到着駅は○○で宜しいですか』のような到
着駅確認のためのメッセージ出力を省略することができ
る。このようなメッセージ出力の要否を判断するため、
S74では、S72を通過したか否かを判断しているの
である。
【0104】また、S72を通っている場合は、出発駅
の認識が不適切な場合であるが、出発駅のみ、その認識
が不適切であるのか、出発駅および到着駅の両者の認識
が不適切であるのかは分からない。そこで、S74に
て、S72を通っていると判断された場合は、制御部1
8の制御により、例えば『到着駅は○○で宜しいです
か』のようなメッセージが電話4に出力され、到着駅の
確認が行われる(S75)。
【0105】利用者が、上記メッセージを受けて、到着
駅が適切な場合には『はい』を、不適切な場合には『い
いえ』を発話すると、音声認識部12は、そのような
『はい』と『いいえ』とを認識し(S76)、制御部1
8が利用者の返事が『はい』であるか否かを判断する
(S77)。
【0106】S77にて、利用者の返事が『いいえ』で
あった場合には、制御部18の制御により、例えば『到
着駅をおっしゃって下さい。』のようなメッセージが電
話4に出力され、利用者による到着駅の再発話が促され
る(S78)。そして、S78にて利用者が発した到着
駅を音声認識部12が認識すると(S79)、S75に
戻り、再発話された到着駅の確認が行われることにな
る。このような利用者による到着駅の再発話により、到
着駅の誤認識が正されることになる。
【0107】一方、上記したS74にて、S72を通っ
ていないと判断された場合は、上記したように到着駅の
認識が不適切であることが確定するため、S74からS
78に直接移行し、S78以降の動作が行われる。
【0108】S77にて、利用者の返事が『はい』であ
り、到着駅の確認を終了している場合には、制御部18
の制御により、例えば『出発時間は○時○○分で宜しい
でしょうか』のようなメッセージが電話4に出力され、
最後に出発時間の確認が行われる(S80)。利用者
が、上記メッセージを受けて、出発時間が適切な場合に
は『はい』を、不適切な場合には『いいえ』を発話する
と、音声認識部12は、そのような『はい』と『いい
え』とを認識し(S81)、制御部18が利用者の返事
が『はい』であったか否かを判断する(S82)。
【0109】S82にて、利用者の返事が『はい』であ
り、出発時間が適切であった場合には、上述した一連の
再認識処理を終了し、図7のS40に移行する。一方、
S82にて、利用者の返事が『いいえ』であり、出発時
間が不適切であった場合には、S64に移行し、出発時
間の再確認が行われる。
【0110】なお、S69〜S73までの出発駅認識に
関する処理と、S75〜S79までの到着駅認識に関す
る処理とは、逆の順序で行われてもよい。
【0111】以上の再認識処理により、出発駅、到着
駅、出発時間のいずれかでも誤認識されていた場合に
は、その誤認識を正すことができる。
【0112】(3−2−4.音声認識の手法)次に、図
7のS35における、音声認識部12による出発駅、到
着駅、出発時間に関する音声情報の認識の手法につい
て、図9に基づいて説明する。なお、以下での説明を分
かりやすくするため、ここでは、利用者が、『○○から
○○まで、○○時○○分発の列車』のように発話した場
合を想定する。
【0113】基本的には、音声認識部12は、『か
ら』、『まで』、『時』、『分』の発話を検出すると共
に、『から』の直前に発話された音声を出発駅と認識
し、『まで』の直前に発話された音声を到着駅と認識
し、『時』の直前に発話された音声と『分』の直前に発
話された音声とを出発時間と認識する。
【0114】また、音声認識部12は、出発駅、到着
駅、出発時間として発話される可能性のあるものを並べ
た図9のテーブルを有しており、このテーブルを用いて
音声情報をテキストデータに変換する。
【0115】例えば、『から』の直前に発話された音声
が“tokyo ”であれば、音声認識部12は、図9の〔出
発駅〕の候補の中から“tokyo ”を抜き出し、出発駅と
して“tokyo ”が発話されたことを認識する(dep “to
kyo ”)。
【0116】また、『まで』の直前に発話された音声が
例えば“shin-osaka”であれば、音声認識部12は、図
9の〔到着駅〕の候補の中から“shin-osaka”を抜き出
し、到着駅として“shin-osaka”が発話されたことを認
識する(arr “shin-osaka”)。
【0117】また、『時』の直前に発話された音声が例
えば“juroku”であれば、音声認識部12は、図9の
〔出発時間(hour)〕の候補の中から“juroku”を抜き
出し、出発時間のhourとして“juroku”が発話されたこ
とを認識する($hm.hour“16”)。
【0118】同様に、『分』の直前に発話された音声が
例えば“rei ”であれば、音声認識部12は、図9の
〔出発時間(minute)〕の候補の中から“rei ”を抜き
出し、出発時間のminuteとして“rei ”が発話されたこ
とを認識する($hm.minute“00”)。なお、『分』の
発話が検出されなかった場合、音声認識部12は、
『分』の発話が省略されたものとして、出発時間のminu
teを上記と同様に$hm.minute“00”と認識する。
【0119】なお、上記の“dep ”、“arr ”、“hm.h
our ”、“hm.minute ”は、それぞれ出発駅、到着駅、
出発時間(hour)、出発時間(minute)に対応するスロ
ットである。
【0120】したがって、利用者が『東京から大阪まで
16時』と発話すると、音声認識部12は、『dep =to
kyo ,arr =shin-osaka,$hm.hour=16,$hm.minute
=00』のテキストデータを作成する。
【0121】なお、利用者の発話の仕方は上記に限定さ
れるわけではない。音声認識部12が、発話された音声
の中からキーワードを検出し、そのキーワードの直前に
発話された語句をテーブルを用いて認識できるようにす
れば、様々な発話のバリエーションにも対応することが
できる。
【0122】例えば、音声認識部12が上記の『から』
の代わりに『出発』の発話を検出すると共に、『出発』
の直前に発話された音声を出発駅と認識するようにすれ
ば、利用者が例えば以下のように発話した場合でも、上
記と同様の手法で音声認識することが可能となる。
【0123】(1) ○○時○○分、○○出発、○○まで (2) ○○時○○分、○○出発のチケット、○○まで (3) ○○時○○分、○○出発の切符、○○まで (4) ○○時○○分、○○出発、○○到着 (5) ○○時○○分、○○出発、○○到着のチケット(切
符) また、利用者が列車の出発時間を明確に把握していない
場合には、出発時間として『○○時ごろ』のように発話
する場合がある。この場合には、『ごろ(goro)』を音
声として認識したときに、指定された時間の例えば前後
30分の範囲内に出発時間がある列車(14時と発話さ
れたときは、出発時間が13時30分から14時30分
までの列車)をWebサーバ2が検索できるように、音
声認識部12がテキストデータを作成すればよい。
【0124】(3−2−5.認識結果の変換)次に、図
7のS40における、認識結果の変換処理の詳細につい
て、図10(a)(b)に示す変換テーブルを用いて説
明する。なお、ここでは、図7のS35における音声認
識部12での認識結果が正しいことが確認済みであり、
その認識結果が『dep =tokyo ,arr =shin-osaka,$h
m.hour=16,$hm.minute=00』であるとする。
【0125】また、Webサーバ2が受け付ける内容
(Web変数)は、例えば以下のように設定されている
とする。
【0126】 出発駅 ; D STATION 到着駅 ; A STATION (ただし、『STATION』の後にくる駅名は漢字) 出発時間 ; D HOUR,D MINUTE まず、Web入力用データ変換部13は、図10(a)
に示すスロット変換テーブルを用い、“dep ”、“arr
”、“hm.hour ”、“hm.minute ”の各スロットを、
それぞれ、“D STATION”、“A STATI
ON”、“D HOUR”、“D MINUTE”に変
換する。
【0127】また、Web入力用データ変換部13は、
図10(b)に示す認識結果変換テーブルを用い、出発
駅、到着駅の認識結果(駅名)を漢字に変換する。
【0128】この結果、『dep =tokyo ,arr =shin-o
saka,$hm.hour=16,$hm.minute=00』の認識結果
は、最終的に、『D STATION=東京,A ST
ATION=新大阪,D HOUR=16,D MIN
UTE=00』に変換されることになる。このようにし
て、Webサーバ2に対応するデータがWeb入力用デ
ータ変換部13にて作成され、Webサーバ2に送信さ
れる。
【0129】なお、先にも述べた通り、音声認識部12
にWeb入力用データ変換部13の機能を持たせれば、
Web入力用データ変換部13を省略することができ
る。
【0130】(3−2−6.検索結果の音声化処理)次
に、本発明の特徴である、図7のS43における検索結
果の音声化処理の詳細について説明する。本音声化処理
の手法は、以下に示す2通りがあるので、順にそれらを
説明する。
【0131】(音声化処理その1)音声化処理の第1の
手法は、抽出部15が、Webサーバ2がIVR5から
のテキストデータに基づいて情報の検索を行った結果と
して複数の検索結果を受信したときに、個々の検索結果
をその種類ごとに複数桁からなるフラグの各桁およびそ
の数字に対応させると共に、個々の検索結果の利用者へ
の提供の必要性を、上記フラグの各桁の数字に基づいて
判断し、読み上げ部16が、抽出部15での判断結果に
応じて、検索結果をフラグの各桁およびその数字に対応
する音声に変換することにより音声化処理を行うもので
ある。以下、この第1の手法について、図12および図
13のフローチャートに基づいて具体的に説明する。
【0132】なお、ここでは、利用者の『東京から大阪
まで16時』との発話に基づき、Webサーバ2が予約
状況を検索した結果、例えば図11に示すような検索結
果が得られ、上記検索結果がIVR5のデータ送受信部
14を介して抽出部15に入力されているものとする。
【0133】また、図11では、“○”は空席に十分余
裕あり、“△”は空席に若干余裕あり、“×”は満席を
意味しており、“○”、“△”、“×”の付された縦4
列は、左の列から順に、『普通車・禁煙席』、『普通車
・喫煙席』、『グリーン車・禁煙席』、『グリーン車・
喫煙席』の4種類の座席の予約状況を示しているものと
する。
【0134】まず、抽出部15は、図11におけるn列
目に記載の列車の列車名を抽出し(S101)、その列
車の出発時間を抽出する(S102)。そして、抽出部
15は、その列車について、フラグを“0000”に設
定する(S103)。なお、nは1以上の整数であり、
最初はデフォルトでn=1となっている。また、図11
の場合、nの最大値は12となる。
【0135】続いて、抽出部15は、1列目の列車の
『普通車・禁煙席』の予約状況をチェックし、“○”ま
たは“△”が付されていれば、フラグに“0001”を
加算する(S104)。次に、抽出部15は、1列目の
列車の『普通車・喫煙席』の予約状況をチェックし、
“○”または“△”が付されていれば、フラグに“00
10”を加算する(S105)。
【0136】次に、抽出部15は、1列目の列車の『グ
リーン車・禁煙席』の予約状況をチェックし、“○”ま
たは“△”が付されていれば、フラグに“0100”を
加算する(S106)。最後に、抽出部15は、1列目
の列車の『グリーン車・喫煙席』の予約状況をチェック
し、“○”または“△”が付されていれば、フラグに
“1000”を加算する(S107)。
【0137】したがって、上記4種類の座席のいずれか
に空席があれば、4桁のフラグの各位のいずれかに
“1”が存在することになる。また、4桁のフラグの各
位の数字は、上記4種類の座席における空席の有無に対
応するものとなる。
【0138】その後、抽出部15は、フラグが“000
0”であるか否かを判断する(S108)。フラグが
“0000”であれば、この場合は、1列目の列車の4
種類の座席は満席であることになるので、n=n+1と
し(S109)、S101に戻って、今度は2列目の列
車について上記の処理を繰り返す。
【0139】一方、S108にて、フラグが“000
0”でなければ、上記4種類の座席のいずれかに空席が
あることになる。この場合、抽出部15は、まず、4桁
のフラグの一の位が“1”であるか否かを判断し(S1
10)、“1”であれば、読み上げ部16が『16時0
0分発のぞみ59号は、普通車の禁煙席が空いていま
す。』というメッセージを音声で再生する(S11
1)。一方、S110にて、一の位が“1”でなけれ
ば、次のS112に移行する。
【0140】S112では、抽出部15は、4桁のフラ
グの十の位が“1”であるか否かを判断し、“1”であ
れば、読み上げ部16が『16時00分発のぞみ59号
は、普通車の喫煙席が空いています。』というメッセー
ジを音声で再生する(S113)。一方、S112に
て、十の位が“1”でなければ、次のS114に移行す
る。
【0141】S114では、抽出部15は、4桁のフラ
グの百の位が“1”であるか否かを判断し、“1”であ
れば、読み上げ部16が『16時00分発のぞみ59号
は、グリーン車の禁煙席が空いています。』というメッ
セージを音声で再生する(S115)。一方、S114
にて、百の位が“1”でなければ、次のS116に移行
する。
【0142】S116では、抽出部15は、4桁のフラ
グの千の位が“1”であるか否かを判断し、“1”であ
れば、読み上げ部16が『16時00分発のぞみ59号
は、グリーン車の喫煙席が空いています。』というメッ
セージを音声で再生する(S117)。一方、S117
にて、千の位が“1”でなければ、次のS118に移行
する。
【0143】なお、図11の例では、1列目の列車につ
いては、空席状況は全て“×”であるので、実際には、
1列目の列車について上述のようなメッセージが再生さ
れることはない。
【0144】このように、4桁のフラグの各位を、上記
4種類の座席と対応付けることで、抽出部15は、上記
4種類の座席の空席状況を、座席の種類ごとに把握する
ことができる。また、各位が“1”である場合のみ、つ
まり、空席が存在する場合のみ、読み上げ部16が該当
するメッセージを読み上げるので、利用者に不必要な情
報(満席の情報)が提供されることはない。
【0145】以上の処理を、n=12となるまで繰り返
す。すなわち、抽出部15は、nが最大値であるか否か
を判断し(S118)、最大値でない場合には、n=n
+1として(S119)、S101に戻り、S101以
降の処理を繰り返す。一方、S118にて、nが最大値
である場合には、上記した音声化処理を終了する。
【0146】なお、上記した音声化処理では、空席の程
度によらず、つまり、図11の“○”と“△”とを区別
せずに音声化処理を行っているが、上述した音声化処理
の考え方を利用すれば、“○”と“△”とを区別して音
声を出力することも可能である。
【0147】例えば、上述のS104にて、1列目の列
車の『普通車・禁煙席』の予約状況が“○”であれば、
抽出部15は、フラグに“0001”を加算し、上記予
約状況が“△”であれば、フラグに“0002”を加算
するようにする。
【0148】S105でも同様に、1列目の列車の『普
通車・喫煙席』の予約状況が“○”であれば、抽出部1
5は、フラグに“0010”を加算し、上記予約状況が
“△”であれば、フラグに“0020”を加算するよう
にする。
【0149】S106でも同様に、1列目の列車の『グ
リーン車・禁煙席』の予約状況が“○”であれば、抽出
部15は、フラグに“0100”を加算し、上記予約状
況が“△”であれば、フラグに“0200”を加算する
ようにする。
【0150】S107でも同様に、1列目の列車の『グ
リーン車・喫煙席』の予約状況が“○”であれば、抽出
部15は、フラグに“1000”を加算し、上記予約状
況が“△”であれば、フラグに“2000”を加算する
ようにする。
【0151】その後は、フラグの各位の数字が“1”で
あれば、対応する座席には十分空席があり、フラグの各
位の数字が“2”であれば、対応する座席には若干空席
がある旨のメッセージを出力するようにすればよい。
【0152】このように、上記4種類の座席の空席の程
度に応じて、フラグの各位の数字を設定すれば、その
後、4桁のフラグの各位の数字を見ることで、空席/満
席のみならず、十分空席あり/若干空席ありを区別して
音声出力することができる。
【0153】(音声化処理その2)次に、音声化処理の
第2の手法について説明する。本第2の手法は、上述し
た第1の手法のようにフラグという概念を用いず、記号
/音声対応DB17に格納されている、検索結果の種類
に対応する記号情報を認識するための記号認識テーブル
を用いて座席の種別を区別し、音声出力する手法であ
る。
【0154】つまり、音声化処理の第2の手法は、抽出
部15が、Webサーバ2がIVR5からのテキストデ
ータに基づいて情報の検索を行った結果として複数の検
索結果を上記記号情報と対応付けて受信したときに、抽
出した検索結果に対応する記号情報を、上記記号認識テ
ーブルに基づいて認識し、読み上げ部16が、上記検索
結果を上記認識結果に対応する音声に変換することによ
り音声化処理を行うものである。以下、この第2の手法
について、図14および図15に基づいて説明する。
【0155】図14は、記号/音声対応DB17に格納
されている記号認識テーブルの一例を示している。We
bサーバ2から送信される検索結果の中には、普通車、
グリーン車、禁煙席、喫煙席の各記号に対応して、“no
rmal.gif”、“green.gif ”、“no-smoke.gif”、“sm
oke.gif ”などのgif 形式のデータが含まれている。し
たがって、抽出部15は、図14の記号認識テーブルを
参照することにより、“normal.gif”を『普通車』と、
“green.gif ”を『グリーン車』と、“no-smoke.gif”
を『禁煙席』と、“smoke.gif ”を『喫煙席』と認識す
ることができる。
【0156】以下、このような認識に基づく音声化処理
を図15のフローチャートに基づいて説明する。
【0157】図11に示したような検索結果がWebサ
ーバ2からIVR5に送信されたとすると、抽出部15
は、図11の表において、どの情報を空席と認識するの
かをチェックする(S131)。ここでは、先にも述べ
た通り、図11中の“○”または“△”が空席に対応し
ているので、そのような“○”または“△”を空席とし
て認識し、その検索を行うことが確認される。
【0158】なお、予め、“○”または“△”を検索す
るように抽出部15を設定していれば、このS131の
処理は不要である。また、図14に示すように、
“○”、“△”、“×”と空席状況との対応関係も予め
記号認識テーブルに格納しておき、抽出部15がこのテ
ーブルを参照することで、空席を認識するようにしても
よい。なお、この点は、先の第1の手法でも同じであ
る。
【0159】次に、抽出部15は、図11において、
“○”または“△”を検索する(S132)。そして、
“○”または“△”を検出した場合、その“○”または
“△”の座席の種類の記号(普通車、グリーン車、禁煙
席、喫煙席を示す記号)を参照する(S133)。この
参照は、図11の表の一番上の欄を参照すればよい。
【0160】続いて、抽出部15は、参照した記号に対
応する情報(gif )から、上記記号の内容(種類)を、
記号/音声対応DB17の記号認識テーブルに基づいて
認識する(S134)。これにより、抽出部15は、
“○”または“△”の座席の種類が、『普通車』、『グ
リーン車』、『禁煙席』、『喫煙席』のいずれであるか
を認識することができる。
【0161】次に、抽出部15は、S134での認識結
果に基づいて、読み上げ部16が読み上げるプロンプト
を作成する(S135)。例えば、図11の例では、抽
出部15は、『16時07分発ひかり131号は、グリ
ーン車の禁煙席および喫煙席が空いています。』、『1
6時21分発ひかり237号は、普通車の禁煙席、グリ
ーン車の禁煙席および喫煙席が空いています。』、…な
どのプロンプトを、図11の表の上から順番に作成す
る。その後、読み上げ部16は、S135にて作成され
たプロンプトを音声に変換し、順に読み上げる(S13
6)。
【0162】なお、以上では、“○”または“△”を区
別せずに音声化処理しているが、S132にて“○”と
“△”とを区別して検索し、その検索結果をS135で
のプロンプト作成に反映するようにすれば、“○”と
“△”とを区別して音声出力することが可能となる。こ
の場合、“△”の空席状況については、例えば、『16
時07分発ひかり131号は、グリーン車の禁煙席およ
び喫煙席の空席が残り少ないです。』のようなメッセー
ジが出力され、“○”の空席状況については、例えば、
『16時21分発ひかり237号は、普通車の禁煙席、
グリーン車の禁煙席および喫煙席の空席に余裕がありま
す。』のようなメッセージが出力される。
【0163】このような手法により、利用者に有益な空
席の情報のみが利用者に提供されることになる。
【0164】また、本手法によれば、図11の表のフォ
ーマットが変わっても、つまり、『普通車』と『グリー
ン車』の位置が入れかわっても、あるいは、『禁煙席』
と『喫煙席』の位置が入れかわっても、座席の種類を示
す記号を参照して認識することで、上記と同様のプロン
プトを再生することができる。
【0165】(4.本実施形態の効果)以上のように、
IVR5をWebサーバ2と接続して予約システムを構
成することで、IVR5のインターフェース部分は、D
B3が複数存在する場合であっても、各DB3の仕様に
関係なく、オープンでかつ各DB3に共通して使えるも
のとなる。したがって、IVR5の開発および施設メン
テナンス業者によるIVR5のメンテナンスがしやすく
なり、ひいては、開発コスト、メンテナンスコストを低
減することが可能となる。
【0166】また、各DB3の仕様が変更になっても、
IVR5のインターフェース部分を変更する必要がな
く、既存のIVR5のままで対応できるというメリット
もある。さらに、VXMLを用いる場合のように、We
bサーバ2をVXMLに対応するように変更する必要も
なく、既存のWebサーバ2を利用して予約システムを
構築することができる。
【0167】また、音声サービスは、インターネットで
提供するサービスとは別の新たなサービスとなるため、
そのような音声サービスを利用者に提供することは、一
般的にはサービス提供者側の設備確立の負担の増加につ
ながる。しかし、本発明の予約システムは、既存の設備
を最大限に活用したものであり、システムの開発工数も
少なくできるので、音声サービスを提供する予約システ
ムの確立にあたり、サービス提供者側の負担の確実に低
減することができる。
【0168】その結果、予約システムにおける音声サー
ビスを、インターネットを利用したサービスの付加サー
ビスとして容易に広げることができ、利用者に満足のい
くサービスを確実に提供することができる。
【0169】また、上述した検索結果の音声化処理によ
り、利用者にとって有益な検索結果だけが音声で利用者
に提供されるので、利用者が不必要な情報を聞く場合の
ような不快感を味わうことがない。また、電話4での音
声入力時には、不必要な情報がカットされる分、通話時
間も短縮されるので、無駄な通信費をカットすることが
できる。
【0170】(5.補足)以上では、列車の座席の予約
を行う場合について説明したが、例えば通信販売で扱う
商品の予約サービスにも適用することができる。
【0171】図16は、通信販売で扱う商品の予約サー
ビスを実現するためのシステムを模式的に示している。
Webサーバ2が、同図に示す登録ページを画面ベース
で有しているとすると、利用者は、インターネット端末
1からユーザIDやパスワード、希望商品、希望配達日
などを入力し、Webサーバ2に送信する。あるいは、
利用者は、電話4から上記各情報を音声でIVR5に入
力すると、IVR5は上記音声情報を認識して、認識結
果をテキストベースでWebサーバ2に送信する。
【0172】Webサーバ2は、インターネット端末1
またはIVR5から送信されるデータに基づいて、該当
する商品の検索を行い、上記商品の予約状況を検索し、
確認する。Webサーバ2での検索結果は、テキストベ
ースでインターネット端末1またはIVR5に送信され
る。
【0173】インターネット端末1では、その結果がモ
ニタに表示されるが、その表示内容に基づいて、利用者
が商品を予約希望であることを入力すると、Webサー
バ2は上記商品の予約処理を行い、予約が完了した旨を
インターネット端末1に送信し、登録完了画面をモニタ
に表示させる。
【0174】一方、IVR5は、Webサーバ2での処
理結果をテキスト文字列として取得し、その解析を行
う。そして、その解析結果を音声情報に変換した後、電
話4に出力し、利用者に商品の予約の確認を行う。
【0175】ところで、以上で説明したIVR5での処
理は、プログラムで実現することが可能である。このプ
ログラムはコンピュータで読み取り可能な記録媒体に格
納されている。本発明では、この記録媒体として、記憶
部19であってもよいし、IVR5で処理が行われるた
めに必要な図示していないメモリ(例えばROMそのも
の)であってもよいし、また図示していないが外部記憶
装置としてプログラム読み取り装置が設けられ、そこに
記録媒体を挿入することで読み取り可能なプログラムメ
ディアであってもよい。
【0176】上記いずれの場合においても、格納されて
いるプログラムはマイクロプロセッサ(図示せず)のア
クセスにより実行される構成であってもよいし、格納さ
れているプログラムを読み出し、読み出したプログラム
を図示されていないプログラム記憶エリアにダウンロー
ドすることにより、そのプログラムが実行される構成で
あってもよい。この場合、ダウンロード用のプログラム
は予め本体装置に格納されているものとする。
【0177】ここで、上記プログラムメディアは、本体
と分離可能に構成される記録媒体であり、磁気テープや
カセットテープ等のテープ系、フロッピーディスクやハ
ードディスク等の磁気ディスクやCD−ROM/MO/
MD/DVD等の光ディスクのディスク系、ICカード
(メモリカードを含む)/光カード等のカード系、ある
いはマスクROM、EPROM、EEPROM、フラッ
シュROM等による半導体メモリを含めた固定的にプロ
グラムを担持する媒体であってもよい。
【0178】また、本発明においては、インターネット
を含む通信ネットワークと接続可能なシステム構成であ
ることから、通信ネットワークからプログラムをダウン
ロードするように流動的にプログラムを担持する媒体で
あってもよい。なお、このように通信ネットワークから
プログラムをダウンロードする場合には、そのダウンロ
ード用プログラムは予め本体装置に格納しておくか、あ
るいは別な記録媒体からインストールされるものであっ
てもよい。
【0179】なお、記録媒体に格納されている内容とし
てはプログラムに限定されず、データであってもよい。
【0180】また、本発明に係る音声応答プログラム
は、以下のように表現することができる。
【0181】つまり、本発明に係る音声応答プログラム
は、利用者によって入力された音声情報に対応するデー
タを生成する手段と、上記データを、情報を格納したデ
ータベースから情報の検索を行う検索サーバに通信回線
を介して送信する手段と、上記データに基づいて上記検
索サーバが情報の検索を行い、その結果を受信したとき
に、受信した検索結果から、利用者への提供が不要な検
索結果を削除して残りの検索結果を抽出する手段と、抽
出した上記検索結果を音声に変換し、利用者に提供する
手段としてコンピュータを機能させるためのプログラム
である。
【0182】また、本発明に係る音声応答装置は、以下
の第1、第2の音声応答装置とも表現することができ
る。
【0183】第1の音声応答装置は、顧客情報や商品情
報(各種チケットや通信販売における商品の予約状況)
を格納したDBとやりとりしている他の装置(例えばW
ebサーバ)を介して、そのDBとやりとりを行う構成
である。
【0184】また、第2の音声応答装置は、htmlお
よびそのサブセット、hdmlを使用しているWebサ
ーバを介して、顧客情報や商品情報を格納したDBとや
りとりを行う構成である。
【0185】なお、以上では、インターネット端末1を
利用した予約サービスと、電話4からの音声入力に基づ
く予約サービスとを両方実現する予約システムについて
説明したが、音声による予約サービスのみを実現するも
のであっても差し支えない。
【0186】また、本システムは、予約情報の検索以外
にも、例えば、市場に出回っている商品(書籍、車、時
計)の情報を検索して、その売れ行きや詳細な情報を見
る場合にも、本システムを利用することができる。
【0187】
【発明の効果】本発明に係る音声応答装置は、以上のよ
うに、情報を格納したデータベースから情報の検索を行
う検索サーバと通信回線を介して接続された音声応答装
置であって、利用者によって入力された音声情報に対応
するデータを生成するデータ生成手段と、上記データを
上記検索サーバに送信する制御を行う制御手段と、上記
データに基づいて上記検索サーバが情報の検索を行い、
その結果を受信したときに、受信した検索結果から、利
用者への提供が不要な検索結果を削除して残りの検索結
果を抽出する情報抽出手段と、抽出した上記検索結果を
音声に変換し、利用者に提供する情報提供手段とを備え
ている構成である。
【0188】また、本発明に係る音声応答方法は、以上
のように、利用者によって入力された音声情報に対応す
るデータを生成するステップと、上記データを、情報を
格納したデータベースから情報の検索を行う検索サーバ
に通信回線を介して送信するステップと、上記データに
基づいて上記検索サーバが情報の検索を行い、その結果
を受信したときに、受信した検索結果から、利用者への
提供が不要な検索結果を削除して残りの検索結果を抽出
するステップと、抽出した上記検索結果を音声に変換
し、利用者に提供するステップとを有している構成であ
る。
【0189】それゆえ、既存の設備を有効利用してシス
テムを構築することができる。これにより、音声サービ
スを提供する提供者側の設備確立のための負担が軽減さ
れるので、サービス提供者は、音声サービスの設備充実
を容易に図ることができ、より充実した音声サービスを
利用者に提供して音声サービスを広げることが可能とな
る。
【0190】また、上記構成によれば、検索結果のう
ち、利用者にとって有益なものだけが利用者に提供され
るので、不必要な情報を聞く場合のような不快感を利用
者が味わうことがないという効果を併せて奏する。
【0191】また、本発明に係る音声応答プログラム
は、以上のように、利用者によって入力された音声情報
に対応するデータを生成する処理と、上記データを、情
報を格納したデータベースから情報の検索を行う検索サ
ーバに通信回線を介して送信する処理と、上記データに
基づいて上記検索サーバが情報の検索を行い、その結果
を受信したときに、受信した検索結果から、利用者への
提供が不要な検索結果を削除して残りの検索結果を抽出
する処理と、抽出した上記検索結果を音声に変換し、利
用者に提供する処理とをコンピュータに実行させるため
のプログラムである構成である。
【0192】また、上記音声応答プログラムは、コンピ
ュータにて読み取り可能な記録媒体に記録されている構
成である。
【0193】それゆえ、上記の音声応答プログラムをコ
ンピュータが実行することにより、本発明の音声応答方
法を実現することが可能となるという効果を奏する。
【0194】本発明に係る音声応答装置は、以上のよう
に、上記データ生成手段が生成するデータは、上記検索
サーバで扱う形式のデータである構成である。
【0195】それゆえ、検索サーバへの入力に適合した
データが音声応答装置から検索サーバに送信されること
になるので、音声情報に則して検索サーバを確実に動作
させることができるという効果を奏する。
【0196】本発明に係る音声応答装置は、以上のよう
に、上記情報抽出手段は、上記検索サーバが上記データ
に基づいて情報の検索を行った結果として複数の検索結
果を受信したときに、個々の検索結果をその種類ごとに
複数桁からなるフラグの各桁およびその数字に対応させ
ると共に、個々の検索結果の利用者への提供の必要性
を、上記フラグの各桁の数字に基づいて判断し、上記情
報提供手段は、上記情報抽出手段での判断結果に応じ
て、検索結果をフラグの各桁およびその数字に対応する
音声に変換する構成である。
【0197】それゆえ、個々の検索結果を、その種類ご
とにフラグの各桁およびその数字に対応させることで、
最終的に、利用者は、個々の検索結果を、その種類ごと
に把握することができる。また、情報提供手段は、情報
抽出手段での判断結果に応じて音声変換するので、上記
判断結果が、利用者への検索結果の提供が不要であると
出た場合は、そのような不要な検索結果の音声変換は中
止され、その検索結果が利用者に提供されることはない
という効果を奏する。
【0198】本発明に係る音声応答装置は、以上のよう
に、検索結果の種類に対応する記号情報を認識するため
の記号認識テーブルを格納している記号認識テーブル格
納手段をさらに備え、上記情報抽出手段は、上記検索サ
ーバが上記データに基づいて情報の検索を行った結果と
して複数の検索結果を上記記号情報と対応付けて受信し
たときに、抽出した検索結果に対応する記号情報を、上
記記号認識テーブルに基づいて認識し、上記情報提供手
段は、抽出した上記検索結果を上記認識結果に対応する
音声に変換する構成である。
【0199】それゆえ、情報抽出手段は、抽出した検索
結果に対応する記号情報を、記号認識テーブルに基づい
て認識するので、検索結果がどの記号情報の内容と対応
しているかを認識することができる。したがって、情報
提供手段が、情報抽出手段にて抽出した検索結果を情報
抽出手段での認識結果に対応する音声に変換すること
で、検索結果をその種類ごとに適切に利用者に音声で提
供することができるという効果を奏する。
【0200】本発明に係る予約システムは、以上のよう
に、上述した音声応答装置と、予約情報を格納したデー
タベースと、上記音声応答装置からのデータを通信回線
を介して受信し、受信したデータに基づいて、上記デー
タベースから予約情報の検索を行い、その検索結果を上
記音声応答装置に送信した後、予約処理を行う検索サー
バとを備えてなる構成である。
【0201】それゆえ、既存の設備を有効利用した予約
システムを構築することができるので、サービス提供者
側の設備確立のための負担が軽減され、サービス提供者
が予約システムの設備充実を容易に図ることができる。
その結果、より充実した音声予約サービスを利用者に提
供することができる。
【0202】また、本発明のIVRを用いることで、利
用者に不要な検索結果(予約状況)が提供されることは
ないので、音声予約サービスの利用者に不快感を与える
ことはないという効果を併せて奏する。
【図面の簡単な説明】
【図1】本発明に係る音声応答装置としてのIVRの概
略の構成を示すブロック図である。
【図2】本発明に係る予約システムの概略の構成を示す
説明図である。
【図3】各項目を入力できるページ画面を示す説明図で
ある。
【図4】(a)は、予約処理が完了した場合の表示画面
例を示す説明図である。(b)は、予約不可能な場合の
表示画面例を示す説明図である。
【図5】上記予約システムにおける処理の大まかな流れ
を示すフローチャートである。
【図6】音声入力に基づく処理の流れの詳細を示すフロ
ーチャートである。
【図7】IVRでの処理の流れの詳細を示すフローチャ
ートである。
【図8】IVRでの再認識処理の流れの詳細を示すフロ
ーチャートである。
【図9】IVRの音声認識部における音声認識の手法を
説明するための説明図である。
【図10】(a)は、音声認識部での認識結果をWeb
サーバに対応するように変換する処理で用いられるスロ
ット変換テーブルを示す説明図であり、(b)は、音声
認識した結果をWebサーバに対応する漢字に変換する
ための認識結果変換テーブルを示す説明図である。
【図11】WebサーバからIVRに送信される検索結
果の一例を示す説明図である。
【図12】第1の手法による検索結果の音声化処理の流
れを示すフローチャートである。
【図13】第1の手法による検索結果の音声化処理の流
れを示すフローチャートである。
【図14】IVRの記号/音声対応DBに格納されてい
る記号認識テーブルの一例を示す説明図である。
【図15】第2の手法による検索結果の音声化処理の流
れを示すフローチャートである。
【図16】通信販売で扱う商品の予約サービスを実現す
るためのシステムを模式的に示す説明図である。
【図17】従来の予約システムの概略の構成を示す説明
図である。
【図18】従来の他の予約システムの概略の構成を示す
説明図である。
【符号の説明】
2 Webサーバ(検索サーバ) 3 DB(データベース) 5 IVR(音声応答装置) 6 インターネット(通信回線) 12 音声認識部(データ生成手段) 13 Web入力用データ変換部(データ生成手段) 15 抽出部(情報抽出手段) 16 読み上げ部(情報提供手段) 17 記号/音声対応DB(記号認識テーブル格納手
段) 18 制御部(制御手段)
フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 17/60 322 G06F 17/60 322 G10L 13/00 H04M 3/42 P 15/00 Z 15/22 3/50 A H04M 3/42 G10L 3/00 R E 3/50 551K 551A 571T Fターム(参考) 5B075 ND04 ND23 NK10 NK13 NK24 PP07 PP24 PQ04 PQ40 UU40 5D015 KK01 KK02 KK04 5D045 AB08 5K015 AA06 AA07 AA10 AD05 5K024 AA76 BB01 BB03 BB04 BB07 CC01 CC09 DD01 DD02 EE06 EE09 FF03 FF06 GG01 GG12

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】情報を格納したデータベースから情報の検
    索を行う検索サーバと通信回線を介して接続された音声
    応答装置であって、 利用者によって入力された音声情報に対応するデータを
    生成するデータ生成手段と、 上記データを上記検索サーバに送信する制御を行う制御
    手段と、 上記データに基づいて上記検索サーバが情報の検索を行
    い、その結果を受信したときに、受信した検索結果か
    ら、利用者への提供が不要な検索結果を削除して残りの
    検索結果を抽出する情報抽出手段と、 抽出した上記検索結果を音声に変換し、利用者に提供す
    る情報提供手段とを備えていることを特徴とする音声応
    答装置。
  2. 【請求項2】上記データ生成手段が生成するデータは、
    上記検索サーバで扱う形式のデータであることを特徴と
    する請求項1に記載の音声応答装置。
  3. 【請求項3】上記情報抽出手段は、上記検索サーバが上
    記データに基づいて情報の検索を行った結果として複数
    の検索結果を受信したときに、個々の検索結果をその種
    類ごとに複数桁からなるフラグの各桁およびその数字に
    対応させると共に、個々の検索結果の利用者への提供の
    必要性を、上記フラグの各桁の数字に基づいて判断し、 上記情報提供手段は、上記情報抽出手段での判断結果に
    応じて、検索結果をフラグの各桁およびその数字に対応
    する音声に変換することを特徴とする請求項1または2
    に記載の音声応答装置。
  4. 【請求項4】検索結果の種類に対応する記号情報を認識
    するための記号認識テーブルを格納している記号認識テ
    ーブル格納手段をさらに備え、 上記情報抽出手段は、上記検索サーバが上記データに基
    づいて情報の検索を行った結果として複数の検索結果を
    上記記号情報と対応付けて受信したときに、抽出した検
    索結果に対応する記号情報を、上記記号認識テーブルに
    基づいて認識し、 上記情報提供手段は、抽出した上記検索結果を上記認識
    結果に対応する音声に変換することを特徴とする請求項
    1または2に記載の音声応答装置。
  5. 【請求項5】利用者によって入力された音声情報に対応
    するデータを生成するステップと、 上記データを、情報を格納したデータベースから情報の
    検索を行う検索サーバに通信回線を介して送信するステ
    ップと、 上記データに基づいて上記検索サーバが情報の検索を行
    い、その結果を受信したときに、受信した検索結果か
    ら、利用者への提供が不要な検索結果を削除して残りの
    検索結果を抽出するステップと、 抽出した上記検索結果を音声に変換し、利用者に提供す
    るステップとを有していることを特徴とする音声応答方
    法。
  6. 【請求項6】利用者によって入力された音声情報に対応
    するデータを生成する処理と、 上記データを、情報を格納したデータベースから情報の
    検索を行う検索サーバに通信回線を介して送信する処理
    と、 上記データに基づいて上記検索サーバが情報の検索を行
    い、その結果を受信したときに、受信した検索結果か
    ら、利用者への提供が不要な検索結果を削除して残りの
    検索結果を抽出する処理と、 抽出した上記検索結果を音声に変換し、利用者に提供す
    る処理とをコンピュータに実行させるためのプログラム
    であることを特徴とする音声応答プログラム。
  7. 【請求項7】請求項6に記載の音声応答プログラムをコ
    ンピュータで読み取り可能に記録してなることを特徴と
    する音声応答プログラムを記録した記録媒体。
  8. 【請求項8】請求項1ないし4のいずれかに記載の音声
    応答装置と、 予約情報を格納したデータベースと、 上記音声応答装置からのデータを通信回線を介して受信
    し、受信したデータに基づいて、上記データベースから
    予約情報の検索を行い、その検索結果を上記音声応答装
    置に送信した後、予約処理を行う検索サーバとを備えて
    なることを特徴とする予約システム。
JP2001006921A 2001-01-15 2001-01-15 音声応答装置、音声応答方法、音声応答プログラム、音声応答プログラムを記録した記録媒体および予約システム Pending JP2002215670A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001006921A JP2002215670A (ja) 2001-01-15 2001-01-15 音声応答装置、音声応答方法、音声応答プログラム、音声応答プログラムを記録した記録媒体および予約システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001006921A JP2002215670A (ja) 2001-01-15 2001-01-15 音声応答装置、音声応答方法、音声応答プログラム、音声応答プログラムを記録した記録媒体および予約システム

Publications (1)

Publication Number Publication Date
JP2002215670A true JP2002215670A (ja) 2002-08-02

Family

ID=18874743

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001006921A Pending JP2002215670A (ja) 2001-01-15 2001-01-15 音声応答装置、音声応答方法、音声応答プログラム、音声応答プログラムを記録した記録媒体および予約システム

Country Status (1)

Country Link
JP (1) JP2002215670A (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005122144A1 (ja) * 2004-06-10 2005-12-22 Matsushita Electric Industrial Co., Ltd. 音声認識装置、音声認識方法、及びプログラム
JP2006121673A (ja) * 2004-10-22 2006-05-11 Microsoft Corp 分散型音声サービス
JP2009521745A (ja) * 2005-12-22 2009-06-04 マイクロソフト コーポレーション 音声で起動されるネットワーク動作
JP2015047299A (ja) * 2013-08-30 2015-03-16 大都販売株式会社 遊技場喫煙管理システム
JP2015047300A (ja) * 2013-08-30 2015-03-16 大都販売株式会社 遊技場喫煙管理システム
JP2015096923A (ja) * 2013-11-15 2015-05-21 ヤフー株式会社 情報処理装置及び方法
EP3073721A1 (en) 2015-03-26 2016-09-28 Gurunavi, Inc. Telephone reservation system
JP2020064308A (ja) * 2016-12-30 2020-04-23 グーグル エルエルシー 選択的センサポーリング
JP2020072414A (ja) * 2018-11-01 2020-05-07 株式会社電話放送局 自動音声応答装置、サーバ装置、自動音声応答方法、テキストメッセージ送信方法、およびプログラム

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005122144A1 (ja) * 2004-06-10 2005-12-22 Matsushita Electric Industrial Co., Ltd. 音声認識装置、音声認識方法、及びプログラム
US7813928B2 (en) 2004-06-10 2010-10-12 Panasonic Corporation Speech recognition device, speech recognition method, and program
JP2006121673A (ja) * 2004-10-22 2006-05-11 Microsoft Corp 分散型音声サービス
US8396973B2 (en) 2004-10-22 2013-03-12 Microsoft Corporation Distributed speech service
JP2009521745A (ja) * 2005-12-22 2009-06-04 マイクロソフト コーポレーション 音声で起動されるネットワーク動作
JP2015047299A (ja) * 2013-08-30 2015-03-16 大都販売株式会社 遊技場喫煙管理システム
JP2015047300A (ja) * 2013-08-30 2015-03-16 大都販売株式会社 遊技場喫煙管理システム
JP2015096923A (ja) * 2013-11-15 2015-05-21 ヤフー株式会社 情報処理装置及び方法
EP3073721A1 (en) 2015-03-26 2016-09-28 Gurunavi, Inc. Telephone reservation system
EP3402176A1 (en) 2015-03-26 2018-11-14 Gurunavi, Inc. Telephone reservation system
JP2020064308A (ja) * 2016-12-30 2020-04-23 グーグル エルエルシー 選択的センサポーリング
JP2020072414A (ja) * 2018-11-01 2020-05-07 株式会社電話放送局 自動音声応答装置、サーバ装置、自動音声応答方法、テキストメッセージ送信方法、およびプログラム

Similar Documents

Publication Publication Date Title
Arons The Audio-Graphical Interface to a Personal Integrated Telecommunications System
US10534623B2 (en) Systems and methods for providing a virtual assistant
US9479931B2 (en) Systems and methods for providing a virtual assistant
US9571645B2 (en) Systems and methods for providing a virtual assistant
US9804820B2 (en) Systems and methods for providing a virtual assistant
US7082397B2 (en) System for and method of creating and browsing a voice web
US9424838B2 (en) Pattern processing system specific to a user group
US7254384B2 (en) Multi-modal messaging
US8755494B2 (en) Method and apparatus for voice interactive messaging
US20050033582A1 (en) Spoken language interface
JP3974419B2 (ja) 音声入力を用いた情報取得方法及び情報取得システム
US7903792B2 (en) Method and system for interjecting comments to improve information presentation in spoken user interfaces
EP3063646A1 (en) Systems and methods for providing a virtual assistant
JPH10501904A (ja) サービスオーダー方法及びそのシステム
KR102076793B1 (ko) 음성을 통한 전자문서 제공 방법, 음성을 통한 전자문서 작성 방법 및 장치
JP2002215670A (ja) 音声応答装置、音声応答方法、音声応答プログラム、音声応答プログラムを記録した記録媒体および予約システム
JP2005518765A (ja) 音声対話システムを動作させる方法
JP2006264859A (ja) エレベータの情報提供装置
JP3316826B2 (ja) 情報案内方法及びその装置
US20220138428A1 (en) Systems and methods for inserting dialogue into a query response
JP3844367B2 (ja) 音声情報通信システム
JP7438479B1 (ja) 音声自動応答装置、音声自動応答方法、音声自動応答プログラム及び音声自動応答システム
JPH1070613A (ja) 住所・氏名のオフライン認識サポートシステム、通信販売等の電話注文受けシステム、および聞き起し画面
JP2001014331A (ja) 情報処理方法、装置及び記憶媒体
KR100506395B1 (ko) 무선 환경에서의 상담원과 음성인식서버를 이용한 정보제공방법 및 시스템

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040127

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20040903

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20041005

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041109

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050107

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050107

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050125

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050802