JP2002215584A - 音声応答装置、音声応答方法、音声応答プログラム並びにこれを記録したコンピュータ読み取り可能な記録媒体 - Google Patents
音声応答装置、音声応答方法、音声応答プログラム並びにこれを記録したコンピュータ読み取り可能な記録媒体Info
- Publication number
- JP2002215584A JP2002215584A JP2001013857A JP2001013857A JP2002215584A JP 2002215584 A JP2002215584 A JP 2002215584A JP 2001013857 A JP2001013857 A JP 2001013857A JP 2001013857 A JP2001013857 A JP 2001013857A JP 2002215584 A JP2002215584 A JP 2002215584A
- Authority
- JP
- Japan
- Prior art keywords
- user
- voice
- input
- information
- personal information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Telephonic Communication Services (AREA)
Abstract
であっても、円滑な再入力を可能とすることにより、利
用者にとって快適な音声入力環境を実現する。 【解決手段】 電話5からの音声入力を対話方式で受け
付けるIVR4に、電話5の利用者による音声入力の内
容を認識する音声認識部12と、音声認識部12の認識
データから上記利用者の個人情報データを抽出して格納
する項目抽出部13及び記憶部18と、上記利用者を特
定する情報を取得し、該情報に基づいて、個人情報デー
タを構成する全項目のうち、既に上記個人情報データ格
納手段に格納されている項目を判定する制御部17と、
この判定結果に対応するメッセージを提供するメッセー
ジ選択部15及び発話部16とを備える。
Description
声入力を対話方式で受け付ける音声応答装置、音声応答
方法、音声応答プログラム並びにこれを記録したコンピ
ュータ読み取り可能な記録媒体に関するものである。
e Response;以下、IVRと略称する)の普及が進んで
いる。このIVRによれば、利用者が所定の事項を音声
で入力すると、音声認識及びこの結果に対応する各種処
理がなされる。このようなIVRを活用すれば、様々な
経済活動を自動化及び合理化することが可能になる。
通じて行われることが多いため、人間(オペレータ)に
よる応対が一般的であるが、IVRを利用することによ
りこのような応対を自動化すれば、サービスコストの削
減や顧客情報のプライバシー保護を図ることができる。
を用いた自動応答システムには次のような問題点が存在
する。一般に、商品注文や金融貸付などを目的として上
記自動応答システムを利用する場合、利用者は電話等の
接続端末から姓名や住所等のプロフィールや商品番号や
希望貸付金額など、各種の情報を音声入力することが必
要となる。したがって、利用者はこれら情報を項目毎に
順次発話して音声入力することになるが、入力すべき項
目が多い場合には上記音声入力に長時間を要することに
なる。
付の与信等を行う場合、入力すべき項目は個人情報の詳
細に渡るため、情報の入力に数十分を要することも少な
くない。
まうことがある。例えば、情報入力に時間がかかり過ぎ
利用者が不快感を感じて自ら通話を中断する場合や、接
続端末として携帯電話を利用するときの電波状態悪化や
自動応答システムを運用するサーバーコンピュータの過
大な通信負担に起因して通話回線が切断される場合など
である。
力を再度最初からやり直す必要があり、時間や通信費用
等の点において極めて大きな負担を強いられていた。ま
た、このような負担は、結果として、IVRを用いた自
動応答システムの利用価値を半減させるという問題点を
招来していた。
を解決するためになされたもので、その目的は、自動応
答に対する音声入力が中断された場合であっても、円滑
な再入力を可能とすることにより、利用者にとって快適
な音声入力環境を実現する音声応答装置、音声応答方
法、音声応答プログラム並びにこれを記録したコンピュ
ータ読み取り可能な記録媒体を提供することにある。
声応答装置は、上記の課題を解決するために、接続端末
からの音声入力を対話方式で受け付ける音声応答装置で
あって、上記接続端末の利用者による音声入力の内容を
認識する音声認識手段と、上記音声認識手段の認識デー
タから上記利用者の個人情報データを抽出して格納する
個人情報データ格納手段と、上記利用者を特定する情報
を取得する利用者特定情報取得手段と、上記利用者特定
情報取得手段が取得した情報に基づいて、個人情報デー
タを構成する全項目のうち、既に上記個人情報データ格
納手段に格納されている項目を判定する既入力情報判定
手段と、上記利用者に、上記既入力情報判定手段の判定
結果に対応するメッセージを提供するメッセージ提供手
段とを備えることを特徴としている。
は、各利用者が有するプロフィール項目(例えば姓名,
生年月日,住所,電話番号)や、各利用者の発注情報項
目(例えば商品名,商品番号,貸付希望金額)から構成
される利用者情報データをいう。
よって上記接続端末から音声入力された内容が認識さ
れ、上記個人情報データ格納手段によって該認識内容に
含まれる利用者の個人情報データが抽出及び格納され
る。この結果、上記個人情報データ格納手段には、利用
者毎の個人情報データが格納される。
記接続端末の利用者を特定するための利用者特定情報を
取得する。利用者特定情報の種類は特に限定されるもの
ではなく、上記接続端末から出力される音声情報や電気
信号等を利用することができる。
定情報取得手段が取得した利用者特定情報に基づいて、
個人情報データを構成する全項目のうち、過去に入力が
行われて既に上記個人情報データ格納手段に格納されて
いる項目を判定する。
報判定手段の判定結果に基づいて、上記既入力情報判定
手段の判定結果に対応するメッセージを上記利用者に提
供する。例えば、前回の音声入力が一部の項目について
のみ行われている場合には、未入力項目を優先して利用
者に順次音声入力させるようなメッセージを提供した
り、前回音声入力の中断を利用者に詫びるメッセージを
提供することができる。後者の場合には、自動応答を中
止して以後の対応をオペレータに交代させることもでき
る。
中断された場合であっても、円滑な再入力を可能とする
ことにより、利用者にとって快適な音声入力環境を実現
することができる。
記の課題を解決するために、請求項1の構成において、
上記メッセージ提供手段は、上記個人情報データを構成
する全項目から上記既入力情報判定手段によって既入力
と判定された項目を省略して残る項目の音声入力を促す
メッセージを提供することを特徴としている。
成する全項目のうち、既に入力及び格納されている項目
については入力が省略されるので、再入力時における重
複入力が回避される。
て、再入力に要する時間を短縮することができるため、
入力時間や通信費用などの利用者負担を軽減することが
可能になる。
記の課題を解決するために、請求項1または2の構成に
おいて、上記利用者特定情報取得手段は、上記利用者特
定情報として、上記個人情報データ格納手段が抽出した
個人情報データの一部を取得することを特徴としてい
る。
取得手段は、上記個人情報データ格納手段が抽出した個
人情報データの一部、例えば利用者の姓名データや、姓
名データと生年月日データとの組み合わせを取得し、こ
れを上記利用者特定情報として利用する。
に加えて、入力された音声情報を有効活用しながら利用
者の特定を行うことができるため、音声応答装置の構成
を簡易なものとすることができる。
記の課題を解決するために、請求項3の構成において、
上記利用者特定情報取得手段が取得する個人情報データ
は、利用者固有のIDデータであることを特徴としてい
る。
ータとは、あらかじめ定められたPIN(Personal Iden
tification Number)番号や金融機関の口座番号、クレジ
ットカード番号など、各利用者に固有であって人物を認
証できるデータをいう。
取得手段は、利用者固有のIDデータを取得し、これを
上記利用者特定情報として利用する。
て、確実な利用者特定を行うことが可能になる。
記の課題を解決するために、請求項1乃至4のいずれか
1項の構成において、上記利用者特定情報取得手段は、
上記利用者特定情報として、上記接続端末から入力され
る音声の周波数情報を取得することを特徴としている。
取得手段は上記接続端末から入力される音声の周波数情
報、例えば音声入力者の声紋データを利用者特定情報と
して利用する。
項の作用効果に加えて、入力音声情報を有効活用しなが
ら利用者特定を行うことができる。
記の課題を解決するために、請求項1乃至5のいずれか
1項の構成において、上記接続端末は電話機であって、
上記利用者特定情報取得手段は、上記利用者特定情報と
して、上記電話機の発信者番号を取得することを特徴と
している。
取得手段は、利用者の選択に応じて半自動的に音声応答
装置に提供される電話の発信者番号を利用者特定情報と
して利用する。
項の作用効果に加えて、利用者特定の確度を更に向上す
ることができる。
記の課題を解決するために、接続端末からの音声入力を
対話方式で受け付ける音声応答方法であって、上記接続
端末の利用者による音声入力の内容を認識するステップ
と、上記音声入力内容の認識データから上記利用者の個
人情報データを抽出して格納するステップと、上記利用
者を特定する情報を取得するステップと、取得した上記
利用者特定情報に基づいて、個人情報データを構成する
全項目のうち、既に入力済みの項目を判定するステップ
と、上記利用者に、上記判定結果に対応するメッセージ
を提供するステップとを備えることを特徴としている。
おいて接続端末から音声入力された個人情報データの内
容が認識され、利用者特定情報取得ステップにおいて上
記接続端末の利用者を特定するための利用者特定情報が
取得される。その後、既入力項目判定ステップにおい
て、上記利用者特定情報に基づいて上記利用者の個人情
報データのうち既に取得済みの項目が判定され、メッセ
ージ提供ステップにおいて、上記判定結果に対応するメ
ッセージが利用者に提供される。
奏することができる。
は、上記の課題を解決するために、接続端末からの音声
入力を対話方式で受け付ける音声応答を実行するために
コンピュータを、上記接続端末の利用者による音声入力
の内容を認識する音声認識手段と、上記音声認識手段の
認識データから上記利用者の個人情報データを抽出して
格納する個人情報データ格納手段と、上記利用者を特定
する情報を取得する利用者特定情報取得手段と、上記利
用者特定情報取得手段が取得した情報に基づいて、個人
情報データを構成する全項目のうち、既に上記個人情報
データ格納手段に格納されている項目を判定する既入力
情報判定手段と、上記利用者に、上記既入力情報判定手
段の判定結果に対応するメッセージを提供するメッセー
ジ提供手段として機能させることを特徴としている。
読み取り可能な記録媒体は、請求項8に記載の音声応答
プログラムを記録したことを特徴としている。
ラムをコンピュータに実行させることによって、請求項
1と同一の作用効果を奏することができる。
図面に基づいて説明すれば、以下の通りである。
ム1(音声応答装置)の概略構成を示す説明図である。
同図に示すように、音声応答システム1はサーバコンピ
ュータ2と、DB3と、IVR4とを備えている。
成、音声応答システム1の主要部であるIVR4の構成
について説明し、その後、音声応答システム1の動作、
音声応答システム1の応答処理例について説明する。
音声応答システム1は図略の電話線を通じて外部の電話
5(接続端末)と接続されている。音声応答システム1
は、電話5を通じて利用者の金融貸付を受け付けること
を目的としており、サービス提供者である金融機関等に
設置される。
4とを図略の送受信ケーブルで結んで、各種データの入
出力や音声応答システム1全体の制御を行うコンピュー
タであり、IVR4からの送受信データを処理すると共
に、これらのデータを適宜DB3に格納する。音声応答
システム1に備えられるサーバコンピュータ2やDB3
の数は任意である。
された各種のデータを格納するデータベースである。D
B3に格納されたデータは、サーバコンピュータ2によ
り、適宜更新されるようになっている。
報を認識し、認識した音声情報をサーバコンピュータ2
で扱うテキスト情報に変換し、前記送受信ケーブルを介
してサーバコンピュータ2に送信するものである。ま
た、IVR4は、逆に、サーバコンピュータ2の指示に
基づいて音声情報を生成し、電話5に出力するようにも
なっている。IVR4のより具体的な構成については後
述する。
携帯電話で構成されており、前記図略の接続線を介し
て、IVR4と音声で通話することが可能となってい
る。
におけるIVR4のより詳細な構成を示すブロック図で
ある。
入出力部11,音声認識部12(音声認識手段),項目
情報抽出部13,データ送受信部14,メッセージ選択
部15,発話部16,制御部17,及び記憶部18を含
む構成である。
情報をやりとりするためのインターフェースを司ってい
る。つまり、音声入出力部11には、電話5からの音声
情報が入力され、また、音声入出力部11からは、サー
バコンピュータ2の指示に基づいてIVR4内で生成さ
れた音声情報が電話5へ出力される。
部11を介して入力された音声情報を認識し、認識した
音声情報をテキスト情報に変換するものである。具体的
には、音声認識部12は音声入出力部11を通じて入力
された音声情報を内蔵の標本音声情報と参照することに
よってテキスト情報化する。例えば、音声認識部12は
全ての『かな』の発音に関する音声情報を標本音声情報
として内蔵しており、上記入力音声情報を上記標本音声
情報と対比することにより、入力音声情報をかな情報に
変換した後、公知のかな漢字変換手段によって、漢字混
じりのテキスト情報を得る。
よる音声認識結果(テキスト情報)から、記憶部18に
格納すべき個人情報データを項目ごとに抽出するもので
ある。つまり、本実施形態において、電話5及び音声入
出力部11から入力される音声情報とこれを音声認識し
たテキスト情報には、各利用者が有するプロフィール項
目(例えば姓名,生年月日,住所,電話番号)や、各利
用者の発注情報項目(例えば商品名,商品番号,貸付希
望金額)から構成される利用者の個人情報データが含ま
れており、項目情報抽出部13は、上記テキスト情報か
ら上記個人情報データを各項目別に抽出して、記憶部1
8に格納する。
8とは一体となって、音声認識部12の認識データから
利用者の個人情報データを抽出して格納する個人情報デ
ータ格納手段としての機能を果たしている。
助詞など、上記個人情報データ以外の不要な情報も含ま
れているので、項目情報抽出部13は上記テキスト情報
から個人情報データとして必要な部分のみを抽出する。
例えば、利用者の姓名に関する上記テキスト情報が『は
い、特許太郎です。』であった場合、項目情報抽出部1
3は、内蔵する辞書データを参照しながら、このテキス
ト情報から固有名詞である『特許太郎』のみを抽出す
る。
には、誤認識部分が含まれる場合もあるので、項目情報
抽出部13は、上記辞書データ等に基づいて、テキスト
情報や抽出後の個人情報データの内容を適宜修正しても
よい。
5及び音声入出力部11を通じて入力された音声情報の
テキスト情報化と、該テキスト情報からの個人情報デー
タの抽出との両者を行うように構成すれば、項目情報抽
出部13を不要とすることができる。
に基づいて、項目情報抽出部13からの個人情報データ
をサーバコンピュータ2に送信したり、逆にサーバコン
ピュータ2からの指示を受信して、メッセージ選択部1
5や制御部17に伝送するためのインターフェースであ
る。
示に基づいて、利用者に提供するメッセージを選択する
構成である。選択対象となるメッセージ自体はあらかじ
め記憶部18に格納されており、メッセージ選択部15
はこれら格納メッセージから最適なものを選択して、発
話部16に送信する。すなわち、メッセージ選択部1
5,記憶部18は一体となって、制御部17の指示に基
づき、メッセージを選択する構成である。
送信されたメッセージを音声に変換するものである。
ocessing Unit )で構成され、IVR4全体(IVR4
の各処理部)の動作を制御するものである。例えば、制
御部17は、IVR4と外部との回線接続や切断の他、
記憶部18に格納されるデータの管理等を行う。
報を取得する利用者特定情報取得手段として、電話5か
ら発信者番号が通知されている場合にはこの発信者番号
を取得する。
ess Memory)、ROM(Read OnlyMemory)、ハードデ
ィスクなどで構成され、上述の各処理部を動作させるた
めのプログラムを格納したり、各処理部にて処理した結
果や、前述のようなメッセージ選択部15が選択すべき
各種メッセージをデータとして格納している。
は、さらに、フロッピー(登録商標)ディスクやCD−
ROMといった記録媒体を駆動し、この記録媒体に対し
て情報を記録または再生するドライブを備えている。
システム1は、電話5からの音声入力を対話方式で受け
付けるものである。音声応答システム1は、制御部17
の制御に従い、音声入出力部11,音声認識部12,項
目情報抽出部13の動作によって、電話5を通じた利用
者の音声入力から利用者の個人データを抽出して、記憶
部18に格納する。
発信者番号が通知されている場合にはこの発信者番号を
取得することにより、利用者特定情報取得手段として機
能する。制御部17が取得する利用者特定情報は上記発
信者番号に限られるものではなく、電話5から入力され
る音声の周波数情報(例えば、利用者の声紋データ)等
であってもよい。
が抽出した前記個人情報データの一部を利用者特定情報
としてもよい。例えば、上記抽出個人情報データのう
ち、利用者の姓名データや、姓名データと生年月日デー
タとの組み合わせを取得し、これを上記利用者特定情報
として利用することができる。この場合、利用者の特定
をより確実にするために、上記抽出個人情報データは、
利用者固有のIDデータ(例えば、あらかじめ定められ
たPIN番号や金融機関の口座番号、クレジットカード
番号)であることが好ましい。
定情報に基づいて、上記個人情報データを構成する全項
目のうち、既に記憶部18に格納されている項目を判定
する既入力情報判定手段として機能する。過去に入力が
完了している項目を判定するためである。制御部17
は、上記判定結果に基づいて、メッセージ選択部15に
メッセージ選択に関する指示を出力し、メッセージ選択
部15はこの指示に従って、上記判定結果に対応するメ
ッセージを選択し、発話部16及び音声入出力部11を
通じて、電話5の利用者に提供する。
いてのみ行われている場合には、未入力項目を優先して
利用者に順次音声入力させるようなメッセージを提供し
たり、前回の音声入力中断を利用者に詫びるメッセージ
を提供することができる。後者の場合には、制御部17
は、自動応答を中止して以後の対応をオペレータに交代
することもできる。
5は、上記個人情報データを構成する全項目から制御部
17によって既入力と判定された項目を省略して残る項
目の音声入力を促すメッセージを選択して電話5の利用
者に提供することが好ましい。例えば、前回入力時に姓
名,生年月日の項目が入力されている場合、メッセージ
選択部15は、姓名,生年月日の項目を省略して、『電
話番号からおっしゃって下さい。』のような音声メッセ
ージを選択する。これにより、個人情報データを構成す
る全項目のうち、既に入力及び格納されている項目につ
いては入力が省略されるので、再入力時における重複入
力が回避される。
部18との機能については、IVR4に接続されるサー
バコンピュータ2やDB3に適宜代替させてもよい。ま
た、記憶部18やDB3には、過去における利用者の返
済情報を示すデータなど任意の情報データを格納できる
ことはいうまでもない。
に、音声応答システム1による応答処理例について説明
する。前述のように、本実施形態の音声応答システム1
は利用者の金融貸付を受け付けることを目的としてお
り、ここでは利用者が電話5を通じて融資を申し込む場
合の応答処理例について、図3乃至図5を用いて説明す
る。
が電話5で音声応答システム1との通話を始めてから、
個人情報データの入力を行う前までの応答処理を説明す
るフローチャートである。
クセスすると、音声応答システム1は、電話5に『いつ
もありがとうございます。○○株式会社でございま
す。』とのメッセージを再生応答する(ステップ31;
以下、ステップは単にSと略記する)。
17は、電話5の発信者番号を取得したか否かを判定す
る(S32)。上記発信者番号が取得できなかった場合
には、個人情報データの入力ステップにジャンプする。
た場合には、音声応答システム1(IVR4)は、記憶
部18またはDB3に格納されている通話記録を検索し
て、同一発信者番号を有する電話5との前回通話におけ
る音声入力が中断されたか否かを判定する(S33)。
つまり、利用者が過去にアクセスを行っている場合に
は、記憶部18またはDB3に上記発信者番号と通話記
録が格納されているので、この通話記録の内容を確認す
る。
18またはDB3に格納された全ての発信者番号の中か
ら今回取得の発信者番号を検索することにより、前回通
話における音声入力の中断有無を判定してもよいし、例
えば、電話5との通話が中断される都度、相手先発信者
番号を記憶部18またはDB3の通話中断者リストに加
えるようにしておき、今回取得の発信者番号を上記通話
中断者リストと対比することにより上記音声入力の中断
有無を判定してもよい。
判定の結果、同一発信者番号からの前回通話が存在しな
い場合や、前回通話時における音声入力が中断していな
い場合にはS36にジャンプする。
力の中断履歴が存在する場合には、音声応答システム1
の制御部17は、記憶部18またはDB3に格納されて
いる通話記録を検索して、同一発信者番号から前回通話
時刻は現時刻から所定時間以内、例えば10分間以内で
あるか否かを判定する(S34)。このような判定を行
うのは、前回通話時刻からの経過時間が短い場合には、
利用者は通話内容を覚えていると考えられるため、前回
の通話内容を活用しながら、より効率的な再入力を促す
ことができるからである。
は所定値以内であると判定した場合、制御部17は、前
回通話における音声入力が個人情報データのどの項目ま
で行われたかを判定して既入力項目確認フラグをたて
る。その後、音声応答システム1は、電話5に対して
『先ほど電話を頂いていたところから入力をお願いしま
す。』とのメッセージを応答して(S37)、個人情報
データの入力ステップにジャンプする。
えていると判定した場合には、制御部17は、現時刻が
オペレータの勤務時間内であるか否かを判定する(S3
5)。このような判定を行うのは、前回音声入力の中断
理由として、利用者が自動対応の音声入力自体や入力に
要する時間の長さを嫌ったことが考えられ、この場合に
は、以後の対応をオペレータに対応させる方が利用者に
とって快適だからである。
タの勤務時間内であることを確認した場合には、音声入
出力部11を通じて電話5に対して『前回は失礼しまし
た。オペレータにお回しします。』との音声メッセージ
を応答し(S38)、以後の通話をオペレータに転送す
る。
合、制御部17は、上記発信者番号からの通話による音
声入力が過去に完了しているか否かを判定する(S3
6)。このような判定を行うのは、過去に音声入力を完
了している場合には、利用者は音声応答システム1の提
供するサービス内容や音声入力手順に習熟していると考
えられる一方、上記完了経験がない場合には、不案内な
利用者に各種利用情報を提供することが好ましいからで
ある。
音声入力の完了履歴がある場合は直接に、上記音声入力
の完了履歴がない場合は利用情報の案内(S39)を行
ってから、個人情報データの入力ステップにジャンプす
る。
プ)図4は、個人情報データの入力ステップにおける音
声応答システム1の応答処理を説明するフローチャート
である。
者の住所,姓名,電話番号,郵便番号,業種,職業,生
年月日,家族構成,勤務先,年収,給料日,入社年月
日,保険区分,独身・既婚,希望連絡先,契約書受取方
法、希望融資額など様々な項目が考えられるが、ここで
は説明の便宜上、利用者に姓名,生年月日,性別,住
所,電話番号を順次音声入力させる場合の処理について
説明する。
制御部17は、記憶部18またはDB3の格納データを
検索することにより、確定済の利用者の姓名が登録され
ているか否かを判定する(S41)。具体的には、制御
部17は、各種の前記利用者特定情報に基づいて利用者
を特定し、該利用者の確定済姓名データが記憶部18ま
たはDB3に格納されているか否かを判定する。
登録されていなければ、音声応答システム1は、利用者
に姓名データの音声入力を促すメッセージを提供して、
電話5から利用者の姓名入力を受け付ける。上記におい
て、確定済の利用者の姓名とは、利用者によって音声入
力した後に音声応答システム1と利用者との間で内容の
確認が行われた姓名データをいうが、その詳細について
は後述する。
登録されていれば、次のステップに進む。続いて、音声
応答システム1は、利用者の生年月日(S42),性別
(S43),住所(S44),電話番号(S45)につ
いて、S41と同一の処理手順を繰り返すことにより、
全ての個人情報データについての音声入力受け付けを完
了する。
報データのうち、既に入力・登録(格納)されている項
目については質問・入力を省略する一方、登録されてい
ない項目については、利用者に音声入力を促すようにメ
ッセージを提供することになる。なお、項目の省略に
は、前記既入力項目確認フラグを利用してもよい。
制御部17が個人情報データの一部、例えば利用者の姓
名データを利用者特定情報として採用する場合には、S
41における姓名データの入力後に利用者を特定して、
入力済の項目(例えば、S42における生年月日データ
やS43における性別データ)の入力受け付けを適宜省
略してもよい。
における利用者と音声応答システム1との対話応答例を
示すと次のようになる。
下さい。』 (S41) 利用者 『特許太郎です。』 音声応答システム 『姓名は、特許太郎さんですね』 利用者 『はい。』 音声応答システム 『ご住所をおっしゃって下さい。』
(S42) 利用者 『○○県△△市××です。』 音声応答システム 『ご住所は○○県△△市××です
ね』 利用者 『はい。』 音声応答システム 『性別をおっしゃって下さい。』
(S43) 利用者 『男性です。』 音声応答システム 『性別は男性ですね』 利用者 『はい。』(以下略)。
次に、図5を用いて、音声応答システム1が個人情報デ
ータの入力受け付けを行う場合の応答について、姓名デ
ータの入力受け付けを例にして説明する。
用者に姓名の音声入力を促すメッセージとして『姓名を
おっしゃって下さい。』と発話する(S51)。
姓名を例えば『特許太郎です。』のように音声入力する
(S52)。
IVR4の音声認識部12で認識することによりテキス
ト情報化した後、項目情報抽出部13によって、該テキ
スト情報から姓名データを項目ごとに抽出する(S5
3)。例えば、姓名における姓部分と名前部分のように
個人情報データを更に小さな部分に分割できる場合に
は、データ管理の自由度向上を目的として、分割状態で
上記抽出を行うことも好ましい。
おける姓名データの認識及び抽出が成功したか否かを判
定する(S54)。例えばIVR4の制御部17が記憶
部18に格納される人名辞書と上記抽出結果とを対比す
ることによって、上記判定を行うことができる。上記判
定の結果、姓名データの認識に失敗した場合には、音声
応答システム1は、電話5の利用者に再入力を促すメッ
セージとして『申し訳ありませんが、もう一度お名前を
○○のようにおっしゃって下さい。』と発話して(S6
2)、S52に戻る。
答システム1は、S53で認識した姓名データを記憶部
18やDB3に格納する(S55)。図中の「確認無」
とは、上記姓名データの認識内容が正しいか否かは利用
者にまだ確認していない状態であることを示している。
の制御によって、利用者に対し『お名前は、○○(特許
太郎さん)でよろしいですか』という確認メッセージを
発話する(S56)。利用者は、上記メッセージを受け
て確認内容が適切な場合には『はい』を、確認内容が不
適切な場合には『いいえ』を発話する(S57)。
認識部12及び制御部17によって、確認メッセージに
対する上記応答は認識結果が正しい(適切な)場合に対
応する『はい』であるか、間違っている(不適切な)場
合に対応する『いいえ』であるかを認識する(S5
8)。
用者の応答の認識に成功したか否かを判定する(S5
9)。この判定の結果、上記認識に失敗した場合には、
音声応答システム1は、電話5の利用者に再応答を促す
メッセージとして『申し訳ありませんが、はい、また
は、いいえ、とおっしゃって下さい。』と発話して(S
63)、S57に戻る。
部17は、認識結果が『はい』であったか否かを判定す
る(S60)。上記認識結果が『はい』でなかった場合
には、音声応答システム1は姓名の入力受け付けに失敗
したものとして、最初のステップ(S51)に戻る。
は、音声応答システム1は、既に記憶部18やDB3に
格納された姓名データを正しいものとして確定する(S
61)。例えば、格納された上記姓名データに内容確認
フラグを付しておく。
答システム1に登録され、姓名データの入力受け付け処
理は終了する。
1が利用者の金融貸付を受け付ける場合について説明し
たが、本発明の適用範囲はこれに限られるものではな
く、電話や無線などによる商品注文、アンケート、クイ
ズなど様々な用途に適用することができる。
を対話方式で受け付ける音声応答方法であって、上記接
続端末の利用者による音声入力の内容を認識するステッ
プと、上記音声入力内容の認識データから上記利用者の
個人情報データを抽出して格納するステップと、上記利
用者を特定する情報を取得するステップと、取得した上
記利用者特定情報に基づいて、個人情報データを構成す
る全項目のうち、既に入力済みの項目を判定するステッ
プと、上記利用者に、上記判定結果に対応するメッセー
ジを提供するステップとを備えることを特徴とする音声
応答方法と表現することもできる。
テム1及びIVR4での処理は、プログラムで実現する
ことが可能である。このプログラムはコンピュータで読
み取り可能な記録媒体に格納されている。本発明では、
この記録媒体として、記憶部18またはDB3であって
もよいし、IVR4で処理が行われるために必要な図示
していないメモリ(例えばROMそのもの)であっても
よいし、また図示していないが外部記憶装置としてプロ
グラム読み取り装置が設けられ、そこに記録媒体を挿入
することで読み取り可能なプログラムメディアであって
もよい。
いるプログラムは、図略のマイクロプロセッサのアクセ
スにより実行される構成であってもよいし、格納されて
いるプログラムを読み出し、読み出したプログラムを図
示されていないプログラム記憶エリアにダウンロードす
ることにより、そのプログラムが実行される構成であっ
てもよい。この場合、ダウンロード用のプログラムは予
め本体装置に格納されているものとする。
と分離可能に構成される記録媒体であり、磁気テープや
カセットテープ等のテープ系、フロッピーディスクやハ
ードディスク等の磁気ディスクやCD−ROM/MO/
MD/DVD等の光ディスクのディスク系、ICカード
(メモリカードを含む)/光カード等のカード系、ある
いはマスクROM、EPROM、EEPROM、フラッ
シュROM等による半導体メモリを含めた固定的にプロ
グラムを担持する媒体であってもよい。
ータ2がインターネットを含む通信ネットワークと接続
される場合は、通信ネットワークからプログラムをダウ
ンロードするように流動的にプログラムを担持する媒体
であってもよい。なお、このように通信ネットワークか
らプログラムをダウンロードする場合には、そのダウン
ロード用プログラムは予め本体装置に格納しておくか、
あるいは別な記録媒体からインストールされるものであ
ってもよい。
ログラムに限定されず、データであってもよい。
以上のように、接続端末からの音声入力を対話方式で受
け付ける音声応答装置であって、上記接続端末の利用者
による音声入力の内容を認識する音声認識手段と、上記
音声認識手段の認識データから上記利用者の個人情報デ
ータを抽出して格納する個人情報データ格納手段と、上
記利用者を特定する情報を取得する利用者特定情報取得
手段と、上記利用者特定情報取得手段が取得した情報に
基づいて、個人情報データを構成する全項目のうち、既
に上記個人情報データ格納手段に格納されている項目を
判定する既入力情報判定手段と、上記利用者に、上記既
入力情報判定手段の判定結果に対応するメッセージを提
供するメッセージ提供手段とを備える構成である。
接続端末から音声入力された内容が認識され、上記個人
情報データ格納手段によって該認識内容に含まれる利用
者の個人情報データが抽出及び格納される。一方、上記
既入力情報判定手段は、上記利用者特定情報取得手段の
取得した利用者特定情報に基づいて、個人情報データを
構成する全項目のうち、過去に入力が行われて既に上記
個人情報データ格納手段に格納されている項目を判定
し、この判定結果に基づいて、上記メッセージ提供手段
はメッセージを上記利用者に提供する。
中断された場合であっても、円滑な再入力を可能とする
ことにより、利用者にとって快適な音声入力環境を実現
することができるという効果を奏する。
上のように、請求項1の構成において、上記メッセージ
提供手段は、上記個人情報データを構成する全項目から
上記既入力情報判定手段によって既入力と判定された項
目を省略して残る項目の音声入力を促すメッセージを提
供する構成である。
目のうち、既に入力及び格納されている項目については
入力が省略されるので、再入力時における重複入力が回
避される。
入力に要する時間を短縮することができるため、入力時
間や通信費用などの利用者負担を軽減することが可能に
なるという効果を奏する。
上のように、請求項1または2の構成において、上記利
用者特定情報取得手段は、上記利用者特定情報として、
上記個人情報データ格納手段が抽出した個人情報データ
の一部を取得する構成である。
は、上記個人情報データ格納手段が抽出した個人情報デ
ータの一部を上記利用者特定情報として利用する。
えて、入力された音声情報を有効活用しながら利用者の
特定を行うことができるため、音声応答装置の構成を簡
易なものとすることができるという効果を奏する。
上のように、請求項3の構成において、上記利用者特定
情報取得手段が取得する個人情報データは、利用者固有
のIDデータである構成である。
は、利用者固有のIDデータを上記利用者特定情報とし
て利用する。
実な利用者特定を行うことが可能になるという効果を奏
する。
上のように、請求項1乃至4のいずれか1項の構成にお
いて、上記利用者特定情報取得手段は、上記利用者特定
情報として、上記接続端末から入力される音声の周波数
情報を取得する構成である。
上記接続端末から入力される音声の周波数情報、例えば
音声入力者の声紋データを利用者特定情報として利用す
る。
項の効果に加えて、入力音声情報を有効活用しながら利
用者特定を行うことができるという効果を奏する。
上のように、請求項1乃至5のいずれか1項の構成にお
いて、上記接続端末は電話機であって、上記利用者特定
情報取得手段は、上記利用者特定情報として、上記電話
機の発信者番号を取得する構成である。
は、利用者の選択に応じて半自動的に音声応答装置に提
供される電話の発信者番号を利用者特定情報として利用
する。
項の効果に加えて、利用者特定の確度を更に向上するこ
とができるという効果を奏する。
上のように、接続端末からの音声入力を対話方式で受け
付ける音声応答方法であって、上記接続端末の利用者に
よる音声入力の内容を認識するステップと、上記音声入
力内容の認識データから上記利用者の個人情報データを
抽出して格納するステップと、上記利用者を特定する情
報を取得するステップと、取得した上記利用者特定情報
に基づいて、個人情報データを構成する全項目のうち、
既に入力済みの項目を判定するステップと、上記利用者
に、上記判定結果に対応するメッセージを提供するステ
ップとを備える構成である。
端末から音声入力された個人情報データの内容が認識さ
れ、利用者特定情報取得ステップにおいて上記接続端末
の利用者を特定するための利用者特定情報が取得され
る。その後、既入力項目判定ステップにおいて、上記利
用者特定情報に基づいて上記利用者の個人情報データの
うち既に取得済みの項目が判定され、メッセージ提供ス
テップにおいて、上記判定結果に対応するメッセージが
利用者に提供される。
ることができる。
は、以上のように、接続端末からの音声入力を対話方式
で受け付ける音声応答を実行するためにコンピュータ
を、上記接続端末の利用者による音声入力の内容を認識
する音声認識手段と、上記音声認識手段の認識データか
ら上記利用者の個人情報データを抽出して格納する個人
情報データ格納手段と、上記利用者を特定する情報を取
得する利用者特定情報取得手段と、上記利用者特定情報
取得手段が取得した情報に基づいて、個人情報データを
構成する全項目のうち、既に上記個人情報データ格納手
段に格納されている項目を判定する既入力情報判定手段
と、上記利用者に、上記既入力情報判定手段の判定結果
に対応するメッセージを提供するメッセージ提供手段と
して機能させる構成である。
読み取り可能な記録媒体は、請求項8に記載の音声応答
プログラムを記録した構成である。
ンピュータに実行させることによって、請求項1と同一
の効果を奏することができる。
(音声応答装置)の一部であるIVRの概略構成を示す
ブロック図である。
である。
システムの応答処理を説明するフローチャートである。
声応答システムの応答処理を説明するフローチャートで
ある。
応答システムの応答処理を説明するフローチャートであ
る。
Claims (9)
- 【請求項1】接続端末からの音声入力を対話方式で受け
付ける音声応答装置であって、 上記接続端末の利用者による音声入力の内容を認識する
音声認識手段と、 上記音声認識手段の認識データから上記利用者の個人情
報データを抽出して格納する個人情報データ格納手段
と、 上記利用者を特定する情報を取得する利用者特定情報取
得手段と、 上記利用者特定情報取得手段が取得した情報に基づい
て、個人情報データを構成する全項目のうち、既に上記
個人情報データ格納手段に格納されている項目を判定す
る既入力情報判定手段と、 上記利用者に、上記既入力情報判定手段の判定結果に対
応するメッセージを提供するメッセージ提供手段とを備
えることを特徴とする音声応答装置。 - 【請求項2】上記メッセージ提供手段は、上記個人情報
データを構成する全項目から上記既入力情報判定手段に
よって既入力と判定された項目を省略して残る項目の音
声入力を促すメッセージを提供することを特徴とする請
求項1に記載の音声応答装置。 - 【請求項3】上記利用者特定情報取得手段は、上記利用
者特定情報として、上記個人情報データ格納手段が抽出
した個人情報データの一部を取得することを特徴とする
請求項1または2に記載の音声応答装置。 - 【請求項4】上記利用者特定情報取得手段が取得する個
人情報データは、利用者固有のIDデータであることを
特徴とする請求項3に記載の音声応答装置。 - 【請求項5】上記利用者特定情報取得手段は、上記利用
者特定情報として、上記接続端末から入力される音声の
周波数情報を取得することを特徴とする請求項1乃至4
のいずれか1項に記載の音声応答装置。 - 【請求項6】上記接続端末は電話機であって、 上記利用者特定情報取得手段は、上記利用者特定情報と
して、上記電話機の発信者番号を取得することを特徴と
する請求項1乃至5のいずれか1項に記載の音声応答装
置。 - 【請求項7】接続端末からの音声入力を対話方式で受け
付ける音声応答方法であって、 上記接続端末の利用者による音声入力の内容を認識する
ステップと、 上記音声入力内容の認識データから上記利用者の個人情
報データを抽出して格納するステップと、 上記利用者を特定する情報を取得するステップと、 取得した上記利用者特定情報に基づいて、個人情報デー
タを構成する全項目のうち、既に入力済みの項目を判定
するステップと、 上記利用者に、上記判定結果に対応するメッセージを提
供するステップとを備えることを特徴とする音声応答方
法。 - 【請求項8】接続端末からの音声入力を対話方式で受け
付ける音声応答を実行するためにコンピュータを、 上記接続端末の利用者による音声入力の内容を認識する
音声認識手段と、 上記音声認識手段の認識データから上記利用者の個人情
報データを抽出して格納する個人情報データ格納手段
と、 上記利用者を特定する情報を取得する利用者特定情報取
得手段と、 上記利用者特定情報取得手段が取得した情報に基づい
て、個人情報データを構成する全項目のうち、既に上記
個人情報データ格納手段に格納されている項目を判定す
る既入力情報判定手段と、 上記利用者に、上記既入力情報判定手段の判定結果に対
応するメッセージを提供するメッセージ提供手段として
機能させるための音声応答プログラム。 - 【請求項9】請求項8に記載の音声応答プログラムを記
録したことを特徴とするコンピュータ読み取り可能な記
録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001013857A JP2002215584A (ja) | 2001-01-22 | 2001-01-22 | 音声応答装置、音声応答方法、音声応答プログラム並びにこれを記録したコンピュータ読み取り可能な記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001013857A JP2002215584A (ja) | 2001-01-22 | 2001-01-22 | 音声応答装置、音声応答方法、音声応答プログラム並びにこれを記録したコンピュータ読み取り可能な記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2002215584A true JP2002215584A (ja) | 2002-08-02 |
Family
ID=18880632
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001013857A Pending JP2002215584A (ja) | 2001-01-22 | 2001-01-22 | 音声応答装置、音声応答方法、音声応答プログラム並びにこれを記録したコンピュータ読み取り可能な記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2002215584A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009237386A (ja) * | 2008-03-28 | 2009-10-15 | Mitsubishi Electric Information Systems Corp | 音声文字変換装置、音声文字変換方法及び音声文字変換プログラム |
JP2014066790A (ja) * | 2012-09-25 | 2014-04-17 | Mitsubishi Electric Corp | エレベータの音声呼び登録装置 |
CN109743436A (zh) * | 2018-12-29 | 2019-05-10 | 苏州思必驰信息科技有限公司 | 用于语音对话的通讯补偿方法和装置 |
-
2001
- 2001-01-22 JP JP2001013857A patent/JP2002215584A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009237386A (ja) * | 2008-03-28 | 2009-10-15 | Mitsubishi Electric Information Systems Corp | 音声文字変換装置、音声文字変換方法及び音声文字変換プログラム |
JP2014066790A (ja) * | 2012-09-25 | 2014-04-17 | Mitsubishi Electric Corp | エレベータの音声呼び登録装置 |
CN109743436A (zh) * | 2018-12-29 | 2019-05-10 | 苏州思必驰信息科技有限公司 | 用于语音对话的通讯补偿方法和装置 |
CN109743436B (zh) * | 2018-12-29 | 2020-08-28 | 苏州思必驰信息科技有限公司 | 用于语音对话的通讯补偿方法、装置、设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10728384B1 (en) | System and method for redaction of sensitive audio events of call recordings | |
US6507643B1 (en) | Speech recognition system and method for converting voice mail messages to electronic mail messages | |
US7277857B1 (en) | Method and system for facilitating restoration of a voice command session with a user after a system disconnect | |
US20020046030A1 (en) | Method and apparatus for improved call handling and service based on caller's demographic information | |
US7899671B2 (en) | Recognition results postprocessor for use in voice recognition systems | |
JP4089148B2 (ja) | 通訳サービス方法および通訳サービス装置 | |
US7609829B2 (en) | Multi-platform capable inference engine and universal grammar language adapter for intelligent voice application execution | |
EP2109097B1 (en) | A method for personalization of a service | |
US8254534B2 (en) | Method and apparatus for automatic telephone menu navigation | |
US7869578B2 (en) | Printer with speech transcription of a recorded voice message | |
US8345830B2 (en) | Method and apparatus for voice interactive messaging | |
US20050043953A1 (en) | Dynamic creation of a conversational system from dialogue objects | |
US20090220056A1 (en) | Interactive Natural Language Calling System | |
US20030064709A1 (en) | Multi-modal messaging | |
US20040006476A1 (en) | Behavioral adaptation engine for discerning behavioral characteristics of callers interacting with an VXML-compliant voice application | |
US20060122840A1 (en) | Tailoring communication from interactive speech enabled and multimodal services | |
US20110106527A1 (en) | Method and Apparatus for Adapting a Voice Extensible Markup Language-enabled Voice System for Natural Speech Recognition and System Response | |
KR20110127180A (ko) | 음성 통신을 이용하여 호스팅된 서비스에 인터렉티브하게 액세스하는 시스템 및 방법 | |
US7395206B1 (en) | Systems and methods for managing and building directed dialogue portal applications | |
US20100185449A1 (en) | Method and system for communicating with an interactive voice response (ivr) system | |
US20090041212A1 (en) | Interactive Voice Response System With Prioritized Call Monitoring | |
US8867708B1 (en) | Systems and methods for visual presentation and selection of IVR menu | |
JP2002215584A (ja) | 音声応答装置、音声応答方法、音声応答プログラム並びにこれを記録したコンピュータ読み取り可能な記録媒体 | |
US20090163188A1 (en) | Method and system of providing an audio phone card | |
US8923838B1 (en) | System, method and computer program product for activating a cellular phone account |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040127 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20040903 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20041008 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20041214 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050209 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20050209 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20050308 |