JP2002215584A

JP2002215584A - 音声応答装置、音声応答方法、音声応答プログラム並びにこれを記録したコンピュータ読み取り可能な記録媒体

Info

Publication number: JP2002215584A
Application number: JP2001013857A
Authority: JP
Inventors: Koji Soma; 宏司相馬; Fumihiko Sakota; 文彦迫田
Original assignee: Omron Corp; Omron Tateisi Electronics Co
Current assignee: Omron Corp
Priority date: 2001-01-22
Filing date: 2001-01-22
Publication date: 2002-08-02

Abstract

(57)【要約】【課題】自動応答に対する音声入力が中断された場合
であっても、円滑な再入力を可能とすることにより、利
用者にとって快適な音声入力環境を実現する。【解決手段】電話５からの音声入力を対話方式で受け
付けるＩＶＲ４に、電話５の利用者による音声入力の内
容を認識する音声認識部１２と、音声認識部１２の認識
データから上記利用者の個人情報データを抽出して格納
する項目抽出部１３及び記憶部１８と、上記利用者を特
定する情報を取得し、該情報に基づいて、個人情報デー
タを構成する全項目のうち、既に上記個人情報データ格
納手段に格納されている項目を判定する制御部１７と、
この判定結果に対応するメッセージを提供するメッセー
ジ選択部１５及び発話部１６とを備える。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、接続端末からの音
声入力を対話方式で受け付ける音声応答装置、音声応答
方法、音声応答プログラム並びにこれを記録したコンピ
ュータ読み取り可能な記録媒体に関するものである。

【０００２】

【従来の技術】近年、音声応答装置（Interactive Voic
e Response；以下、ＩＶＲと略称する）の普及が進んで
いる。このＩＶＲによれば、利用者が所定の事項を音声
で入力すると、音声認識及びこの結果に対応する各種処
理がなされる。このようなＩＶＲを活用すれば、様々な
経済活動を自動化及び合理化することが可能になる。

【０００３】例えば、通信販売の商品注文などは電話を
通じて行われることが多いため、人間（オペレータ）に
よる応対が一般的であるが、ＩＶＲを利用することによ
りこのような応対を自動化すれば、サービスコストの削
減や顧客情報のプライバシー保護を図ることができる。

【０００４】

【発明が解決しようとする課題】しかしながら、ＩＶＲ
を用いた自動応答システムには次のような問題点が存在
する。一般に、商品注文や金融貸付などを目的として上
記自動応答システムを利用する場合、利用者は電話等の
接続端末から姓名や住所等のプロフィールや商品番号や
希望貸付金額など、各種の情報を音声入力することが必
要となる。したがって、利用者はこれら情報を項目毎に
順次発話して音声入力することになるが、入力すべき項
目が多い場合には上記音声入力に長時間を要することに
なる。

【０００５】例えば、自動応答システムによって金融貸
付の与信等を行う場合、入力すべき項目は個人情報の詳
細に渡るため、情報の入力に数十分を要することも少な
くない。

【０００６】しかし、このような音声入力が中断してし
まうことがある。例えば、情報入力に時間がかかり過ぎ
利用者が不快感を感じて自ら通話を中断する場合や、接
続端末として携帯電話を利用するときの電波状態悪化や
自動応答システムを運用するサーバーコンピュータの過
大な通信負担に起因して通話回線が切断される場合など
である。

【０００７】音声入力が中断した場合、利用者は音声入
力を再度最初からやり直す必要があり、時間や通信費用
等の点において極めて大きな負担を強いられていた。ま
た、このような負担は、結果として、ＩＶＲを用いた自
動応答システムの利用価値を半減させるという問題点を
招来していた。

【０００８】本発明は、以上のような従来手法の問題点
を解決するためになされたもので、その目的は、自動応
答に対する音声入力が中断された場合であっても、円滑
な再入力を可能とすることにより、利用者にとって快適
な音声入力環境を実現する音声応答装置、音声応答方
法、音声応答プログラム並びにこれを記録したコンピュ
ータ読み取り可能な記録媒体を提供することにある。

【０００９】

【課題を解決するための手段】請求項１の発明に係る音
声応答装置は、上記の課題を解決するために、接続端末
からの音声入力を対話方式で受け付ける音声応答装置で
あって、上記接続端末の利用者による音声入力の内容を
認識する音声認識手段と、上記音声認識手段の認識デー
タから上記利用者の個人情報データを抽出して格納する
個人情報データ格納手段と、上記利用者を特定する情報
を取得する利用者特定情報取得手段と、上記利用者特定
情報取得手段が取得した情報に基づいて、個人情報デー
タを構成する全項目のうち、既に上記個人情報データ格
納手段に格納されている項目を判定する既入力情報判定
手段と、上記利用者に、上記既入力情報判定手段の判定
結果に対応するメッセージを提供するメッセージ提供手
段とを備えることを特徴としている。

【００１０】上記の構成において、個人情報データと
は、各利用者が有するプロフィール項目（例えば姓名，
生年月日，住所，電話番号）や、各利用者の発注情報項
目（例えば商品名，商品番号，貸付希望金額）から構成
される利用者情報データをいう。

【００１１】上記の構成によれば、上記音声認識手段に
よって上記接続端末から音声入力された内容が認識さ
れ、上記個人情報データ格納手段によって該認識内容に
含まれる利用者の個人情報データが抽出及び格納され
る。この結果、上記個人情報データ格納手段には、利用
者毎の個人情報データが格納される。

【００１２】また、上記利用者特定情報取得手段は、上
記接続端末の利用者を特定するための利用者特定情報を
取得する。利用者特定情報の種類は特に限定されるもの
ではなく、上記接続端末から出力される音声情報や電気
信号等を利用することができる。

【００１３】上記既入力情報判定手段は、上記利用者特
定情報取得手段が取得した利用者特定情報に基づいて、
個人情報データを構成する全項目のうち、過去に入力が
行われて既に上記個人情報データ格納手段に格納されて
いる項目を判定する。

【００１４】上記メッセージ提供手段は、上記既入力情
報判定手段の判定結果に基づいて、上記既入力情報判定
手段の判定結果に対応するメッセージを上記利用者に提
供する。例えば、前回の音声入力が一部の項目について
のみ行われている場合には、未入力項目を優先して利用
者に順次音声入力させるようなメッセージを提供した
り、前回音声入力の中断を利用者に詫びるメッセージを
提供することができる。後者の場合には、自動応答を中
止して以後の対応をオペレータに交代させることもでき
る。

【００１５】これにより、自動応答に対する音声入力が
中断された場合であっても、円滑な再入力を可能とする
ことにより、利用者にとって快適な音声入力環境を実現
することができる。

【００１６】請求項２の発明に係る音声応答装置は、上
記の課題を解決するために、請求項１の構成において、
上記メッセージ提供手段は、上記個人情報データを構成
する全項目から上記既入力情報判定手段によって既入力
と判定された項目を省略して残る項目の音声入力を促す
メッセージを提供することを特徴としている。

【００１７】上記の構成によれば、個人情報データを構
成する全項目のうち、既に入力及び格納されている項目
については入力が省略されるので、再入力時における重
複入力が回避される。

【００１８】これにより、請求項１の作用効果に加え
て、再入力に要する時間を短縮することができるため、
入力時間や通信費用などの利用者負担を軽減することが
可能になる。

【００１９】請求項３の発明に係る音声応答装置は、上
記の課題を解決するために、請求項１または２の構成に
おいて、上記利用者特定情報取得手段は、上記利用者特
定情報として、上記個人情報データ格納手段が抽出した
個人情報データの一部を取得することを特徴としてい
る。

【００２０】上記の構成によれば、上記利用者特定情報
取得手段は、上記個人情報データ格納手段が抽出した個
人情報データの一部、例えば利用者の姓名データや、姓
名データと生年月日データとの組み合わせを取得し、こ
れを上記利用者特定情報として利用する。

【００２１】これにより、請求項１または２の作用効果
に加えて、入力された音声情報を有効活用しながら利用
者の特定を行うことができるため、音声応答装置の構成
を簡易なものとすることができる。

【００２２】請求項４の発明に係る音声応答装置は、上
記の課題を解決するために、請求項３の構成において、
上記利用者特定情報取得手段が取得する個人情報データ
は、利用者固有のＩＤデータであることを特徴としてい
る。

【００２３】上記の構成において、利用者固有のＩＤデ
ータとは、あらかじめ定められたＰＩＮ(Personal Iden
tification Number)番号や金融機関の口座番号、クレジ
ットカード番号など、各利用者に固有であって人物を認
証できるデータをいう。

【００２４】上記の構成によれば、上記利用者特定情報
取得手段は、利用者固有のＩＤデータを取得し、これを
上記利用者特定情報として利用する。

【００２５】これにより、請求項３の作用効果に加え
て、確実な利用者特定を行うことが可能になる。

【００２６】請求項５の発明に係る音声応答装置は、上
記の課題を解決するために、請求項１乃至４のいずれか
１項の構成において、上記利用者特定情報取得手段は、
上記利用者特定情報として、上記接続端末から入力され
る音声の周波数情報を取得することを特徴としている。

【００２７】上記の構成によれば、上記利用者特定情報
取得手段は上記接続端末から入力される音声の周波数情
報、例えば音声入力者の声紋データを利用者特定情報と
して利用する。

【００２８】これにより、請求項１乃至４のいずれか１
項の作用効果に加えて、入力音声情報を有効活用しなが
ら利用者特定を行うことができる。

【００２９】請求項６の発明に係る音声応答装置は、上
記の課題を解決するために、請求項１乃至５のいずれか
１項の構成において、上記接続端末は電話機であって、
上記利用者特定情報取得手段は、上記利用者特定情報と
して、上記電話機の発信者番号を取得することを特徴と
している。

【００３０】上記の構成によれば、上記利用者特定情報
取得手段は、利用者の選択に応じて半自動的に音声応答
装置に提供される電話の発信者番号を利用者特定情報と
して利用する。

【００３１】これにより、請求項１乃至５のいずれか１
項の作用効果に加えて、利用者特定の確度を更に向上す
ることができる。

【００３２】請求項７の発明に係る音声応答方法は、上
記の課題を解決するために、接続端末からの音声入力を
対話方式で受け付ける音声応答方法であって、上記接続
端末の利用者による音声入力の内容を認識するステップ
と、上記音声入力内容の認識データから上記利用者の個
人情報データを抽出して格納するステップと、上記利用
者を特定する情報を取得するステップと、取得した上記
利用者特定情報に基づいて、個人情報データを構成する
全項目のうち、既に入力済みの項目を判定するステップ
と、上記利用者に、上記判定結果に対応するメッセージ
を提供するステップとを備えることを特徴としている。

【００３３】上記の構成によれば、音声認識ステップに
おいて接続端末から音声入力された個人情報データの内
容が認識され、利用者特定情報取得ステップにおいて上
記接続端末の利用者を特定するための利用者特定情報が
取得される。その後、既入力項目判定ステップにおい
て、上記利用者特定情報に基づいて上記利用者の個人情
報データのうち既に取得済みの項目が判定され、メッセ
ージ提供ステップにおいて、上記判定結果に対応するメ
ッセージが利用者に提供される。

【００３４】これにより、請求項１と同一の作用効果を
奏することができる。

【００３５】請求項８の発明に係る音声応答プログラム
は、上記の課題を解決するために、接続端末からの音声
入力を対話方式で受け付ける音声応答を実行するために
コンピュータを、上記接続端末の利用者による音声入力
の内容を認識する音声認識手段と、上記音声認識手段の
認識データから上記利用者の個人情報データを抽出して
格納する個人情報データ格納手段と、上記利用者を特定
する情報を取得する利用者特定情報取得手段と、上記利
用者特定情報取得手段が取得した情報に基づいて、個人
情報データを構成する全項目のうち、既に上記個人情報
データ格納手段に格納されている項目を判定する既入力
情報判定手段と、上記利用者に、上記既入力情報判定手
段の判定結果に対応するメッセージを提供するメッセー
ジ提供手段として機能させることを特徴としている。

【００３６】また、請求項９の発明に係るコンピュータ
読み取り可能な記録媒体は、請求項８に記載の音声応答
プログラムを記録したことを特徴としている。

【００３７】上記の構成によれば、上記音声応答プログ
ラムをコンピュータに実行させることによって、請求項
１と同一の作用効果を奏することができる。

【００３８】

【発明の実施の形態】本発明の実施の一形態について、
図面に基づいて説明すれば、以下の通りである。

【００３９】図２は、本実施形態に係る音声応答システ
ム１（音声応答装置）の概略構成を示す説明図である。
同図に示すように、音声応答システム１はサーバコンピ
ュータ２と、ＤＢ３と、ＩＶＲ４とを備えている。

【００４０】まず、音声応答システム１のシステム構
成、音声応答システム１の主要部であるＩＶＲ４の構成
について説明し、その後、音声応答システム１の動作、
音声応答システム１の応答処理例について説明する。

【００４１】（１．システム構成）図２に示すように、
音声応答システム１は図略の電話線を通じて外部の電話
５（接続端末）と接続されている。音声応答システム１
は、電話５を通じて利用者の金融貸付を受け付けること
を目的としており、サービス提供者である金融機関等に
設置される。

【００４２】サーバコンピュータ２は、ＤＢ３とＩＶＲ
４とを図略の送受信ケーブルで結んで、各種データの入
出力や音声応答システム１全体の制御を行うコンピュー
タであり、ＩＶＲ４からの送受信データを処理すると共
に、これらのデータを適宜ＤＢ３に格納する。音声応答
システム１に備えられるサーバコンピュータ２やＤＢ３
の数は任意である。

【００４３】ＤＢ３は、サーバコンピュータ２から送信
された各種のデータを格納するデータベースである。Ｄ
Ｂ３に格納されたデータは、サーバコンピュータ２によ
り、適宜更新されるようになっている。

【００４４】ＩＶＲ４は、電話５から入力された音声情
報を認識し、認識した音声情報をサーバコンピュータ２
で扱うテキスト情報に変換し、前記送受信ケーブルを介
してサーバコンピュータ２に送信するものである。ま
た、ＩＶＲ４は、逆に、サーバコンピュータ２の指示に
基づいて音声情報を生成し、電話５に出力するようにも
なっている。ＩＶＲ４のより具体的な構成については後
述する。

【００４５】電話５は、音声入力可能な一般加入電話や
携帯電話で構成されており、前記図略の接続線を介し
て、ＩＶＲ４と音声で通話することが可能となってい
る。

【００４６】（２．ＩＶＲの構成）図１は、本実施形態
におけるＩＶＲ４のより詳細な構成を示すブロック図で
ある。

【００４７】同図に示されるように、ＩＶＲ４は、音声
入出力部１１，音声認識部１２（音声認識手段），項目
情報抽出部１３，データ送受信部１４，メッセージ選択
部１５，発話部１６，制御部１７，及び記憶部１８を含
む構成である。

【００４８】音声入出力部１１は、電話５との間で音声
情報をやりとりするためのインターフェースを司ってい
る。つまり、音声入出力部１１には、電話５からの音声
情報が入力され、また、音声入出力部１１からは、サー
バコンピュータ２の指示に基づいてＩＶＲ４内で生成さ
れた音声情報が電話５へ出力される。

【００４９】音声認識部１２は、電話５から音声入出力
部１１を介して入力された音声情報を認識し、認識した
音声情報をテキスト情報に変換するものである。具体的
には、音声認識部１２は音声入出力部１１を通じて入力
された音声情報を内蔵の標本音声情報と参照することに
よってテキスト情報化する。例えば、音声認識部１２は
全ての『かな』の発音に関する音声情報を標本音声情報
として内蔵しており、上記入力音声情報を上記標本音声
情報と対比することにより、入力音声情報をかな情報に
変換した後、公知のかな漢字変換手段によって、漢字混
じりのテキスト情報を得る。

【００５０】項目情報抽出部１３は、音声認識部１２に
よる音声認識結果（テキスト情報）から、記憶部１８に
格納すべき個人情報データを項目ごとに抽出するもので
ある。つまり、本実施形態において、電話５及び音声入
出力部１１から入力される音声情報とこれを音声認識し
たテキスト情報には、各利用者が有するプロフィール項
目（例えば姓名，生年月日，住所，電話番号）や、各利
用者の発注情報項目（例えば商品名，商品番号，貸付希
望金額）から構成される利用者の個人情報データが含ま
れており、項目情報抽出部１３は、上記テキスト情報か
ら上記個人情報データを各項目別に抽出して、記憶部１
８に格納する。

【００５１】すなわち、項目情報抽出部１３と記憶部１
８とは一体となって、音声認識部１２の認識データから
利用者の個人情報データを抽出して格納する個人情報デ
ータ格納手段としての機能を果たしている。

【００５２】ただし、上記テキスト情報には、間投詞や
助詞など、上記個人情報データ以外の不要な情報も含ま
れているので、項目情報抽出部１３は上記テキスト情報
から個人情報データとして必要な部分のみを抽出する。
例えば、利用者の姓名に関する上記テキスト情報が『は
い、特許太郎です。』であった場合、項目情報抽出部１
３は、内蔵する辞書データを参照しながら、このテキス
ト情報から固有名詞である『特許太郎』のみを抽出す
る。

【００５３】また、音声認識部１２による音声認識結果
には、誤認識部分が含まれる場合もあるので、項目情報
抽出部１３は、上記辞書データ等に基づいて、テキスト
情報や抽出後の個人情報データの内容を適宜修正しても
よい。

【００５４】もちろん、音声認識部１２において、電話
５及び音声入出力部１１を通じて入力された音声情報の
テキスト情報化と、該テキスト情報からの個人情報デー
タの抽出との両者を行うように構成すれば、項目情報抽
出部１３を不要とすることができる。

【００５５】データ送受信部１４は、制御部１７の制御
に基づいて、項目情報抽出部１３からの個人情報データ
をサーバコンピュータ２に送信したり、逆にサーバコン
ピュータ２からの指示を受信して、メッセージ選択部１
５や制御部１７に伝送するためのインターフェースであ
る。

【００５６】メッセージ選択部１５は、制御部１７の指
示に基づいて、利用者に提供するメッセージを選択する
構成である。選択対象となるメッセージ自体はあらかじ
め記憶部１８に格納されており、メッセージ選択部１５
はこれら格納メッセージから最適なものを選択して、発
話部１６に送信する。すなわち、メッセージ選択部１
５，記憶部１８は一体となって、制御部１７の指示に基
づき、メッセージを選択する構成である。

【００５７】発話部１６は、メッセージ選択部１５から
送信されたメッセージを音声に変換するものである。

【００５８】制御部１７は、例えばＣＰＵ（Central Pr
ocessing Unit ）で構成され、ＩＶＲ４全体（ＩＶＲ４
の各処理部）の動作を制御するものである。例えば、制
御部１７は、ＩＶＲ４と外部との回線接続や切断の他、
記憶部１８に格納されるデータの管理等を行う。

【００５９】また、制御部１７は、利用者を特定する情
報を取得する利用者特定情報取得手段として、電話５か
ら発信者番号が通知されている場合にはこの発信者番号
を取得する。

【００６０】記憶部１８は、例えばＲＡＭ（Random Acc
ess Memory）、ＲＯＭ（Read OnlyMemory）、ハードデ
ィスクなどで構成され、上述の各処理部を動作させるた
めのプログラムを格納したり、各処理部にて処理した結
果や、前述のようなメッセージ選択部１５が選択すべき
各種メッセージをデータとして格納している。

【００６１】なお、図１では省略しているが、ＩＶＲ４
は、さらに、フロッピー（登録商標）ディスクやＣＤ−
ＲＯＭといった記録媒体を駆動し、この記録媒体に対し
て情報を記録または再生するドライブを備えている。

【００６２】（３．音声応答システムの動作）音声応答
システム１は、電話５からの音声入力を対話方式で受け
付けるものである。音声応答システム１は、制御部１７
の制御に従い、音声入出力部１１，音声認識部１２，項
目情報抽出部１３の動作によって、電話５を通じた利用
者の音声入力から利用者の個人データを抽出して、記憶
部１８に格納する。

【００６３】制御部１７は、前述のように、電話５から
発信者番号が通知されている場合にはこの発信者番号を
取得することにより、利用者特定情報取得手段として機
能する。制御部１７が取得する利用者特定情報は上記発
信者番号に限られるものではなく、電話５から入力され
る音声の周波数情報（例えば、利用者の声紋データ）等
であってもよい。

【００６４】また、制御部１７は、項目情報抽出部１３
が抽出した前記個人情報データの一部を利用者特定情報
としてもよい。例えば、上記抽出個人情報データのう
ち、利用者の姓名データや、姓名データと生年月日デー
タとの組み合わせを取得し、これを上記利用者特定情報
として利用することができる。この場合、利用者の特定
をより確実にするために、上記抽出個人情報データは、
利用者固有のＩＤデータ（例えば、あらかじめ定められ
たＰＩＮ番号や金融機関の口座番号、クレジットカード
番号）であることが好ましい。

【００６５】さらに、制御部１７は、取得した利用者特
定情報に基づいて、上記個人情報データを構成する全項
目のうち、既に記憶部１８に格納されている項目を判定
する既入力情報判定手段として機能する。過去に入力が
完了している項目を判定するためである。制御部１７
は、上記判定結果に基づいて、メッセージ選択部１５に
メッセージ選択に関する指示を出力し、メッセージ選択
部１５はこの指示に従って、上記判定結果に対応するメ
ッセージを選択し、発話部１６及び音声入出力部１１を
通じて、電話５の利用者に提供する。

【００６６】例えば、前回の音声入力が一部の項目につ
いてのみ行われている場合には、未入力項目を優先して
利用者に順次音声入力させるようなメッセージを提供し
たり、前回の音声入力中断を利用者に詫びるメッセージ
を提供することができる。後者の場合には、制御部１７
は、自動応答を中止して以後の対応をオペレータに交代
することもできる。

【００６７】また、制御部１７及びメッセージ選択部１
５は、上記個人情報データを構成する全項目から制御部
１７によって既入力と判定された項目を省略して残る項
目の音声入力を促すメッセージを選択して電話５の利用
者に提供することが好ましい。例えば、前回入力時に姓
名，生年月日の項目が入力されている場合、メッセージ
選択部１５は、姓名，生年月日の項目を省略して、『電
話番号からおっしゃって下さい。』のような音声メッセ
ージを選択する。これにより、個人情報データを構成す
る全項目のうち、既に入力及び格納されている項目につ
いては入力が省略されるので、再入力時における重複入
力が回避される。

【００６８】なお、以上説明のうち、制御部１７と記憶
部１８との機能については、ＩＶＲ４に接続されるサー
バコンピュータ２やＤＢ３に適宜代替させてもよい。ま
た、記憶部１８やＤＢ３には、過去における利用者の返
済情報を示すデータなど任意の情報データを格納できる
ことはいうまでもない。

【００６９】（４．音声応答システムの応答処理例）次
に、音声応答システム１による応答処理例について説明
する。前述のように、本実施形態の音声応答システム１
は利用者の金融貸付を受け付けることを目的としてお
り、ここでは利用者が電話５を通じて融資を申し込む場
合の応答処理例について、図３乃至図５を用いて説明す
る。

【００７０】（４−１．初期ステップ）図３は、利用者
が電話５で音声応答システム１との通話を始めてから、
個人情報データの入力を行う前までの応答処理を説明す
るフローチャートである。

【００７１】利用者が電話５で音声応答システム１にア
クセスすると、音声応答システム１は、電話５に『いつ
もありがとうございます。○○株式会社でございま
す。』とのメッセージを再生応答する（ステップ３１；
以下、ステップは単にＳと略記する）。

【００７２】音声応答システム１（ＩＶＲ４）の制御部
１７は、電話５の発信者番号を取得したか否かを判定す
る（Ｓ３２）。上記発信者番号が取得できなかった場合
には、個人情報データの入力ステップにジャンプする。

【００７３】制御部１７が電話５の発信者番号を取得し
た場合には、音声応答システム１（ＩＶＲ４）は、記憶
部１８またはＤＢ３に格納されている通話記録を検索し
て、同一発信者番号を有する電話５との前回通話におけ
る音声入力が中断されたか否かを判定する（Ｓ３３）。
つまり、利用者が過去にアクセスを行っている場合に
は、記憶部１８またはＤＢ３に上記発信者番号と通話記
録が格納されているので、この通話記録の内容を確認す
る。

【００７４】この場合、音声応答システム１は、記憶部
１８またはＤＢ３に格納された全ての発信者番号の中か
ら今回取得の発信者番号を検索することにより、前回通
話における音声入力の中断有無を判定してもよいし、例
えば、電話５との通話が中断される都度、相手先発信者
番号を記憶部１８またはＤＢ３の通話中断者リストに加
えるようにしておき、今回取得の発信者番号を上記通話
中断者リストと対比することにより上記音声入力の中断
有無を判定してもよい。

【００７５】音声応答システム１の制御部１７は、上記
判定の結果、同一発信者番号からの前回通話が存在しな
い場合や、前回通話時における音声入力が中断していな
い場合にはＳ３６にジャンプする。

【００７６】上記判定の結果、前回通話における音声入
力の中断履歴が存在する場合には、音声応答システム１
の制御部１７は、記憶部１８またはＤＢ３に格納されて
いる通話記録を検索して、同一発信者番号から前回通話
時刻は現時刻から所定時間以内、例えば１０分間以内で
あるか否かを判定する（Ｓ３４）。このような判定を行
うのは、前回通話時刻からの経過時間が短い場合には、
利用者は通話内容を覚えていると考えられるため、前回
の通話内容を活用しながら、より効率的な再入力を促す
ことができるからである。

【００７７】具体的には、前回通話時刻からの経過時間
は所定値以内であると判定した場合、制御部１７は、前
回通話における音声入力が個人情報データのどの項目ま
で行われたかを判定して既入力項目確認フラグをたて
る。その後、音声応答システム１は、電話５に対して
『先ほど電話を頂いていたところから入力をお願いしま
す。』とのメッセージを応答して（Ｓ３７）、個人情報
データの入力ステップにジャンプする。

【００７８】前回通話時刻からの経過時間が所定値を越
えていると判定した場合には、制御部１７は、現時刻が
オペレータの勤務時間内であるか否かを判定する（Ｓ３
５）。このような判定を行うのは、前回音声入力の中断
理由として、利用者が自動対応の音声入力自体や入力に
要する時間の長さを嫌ったことが考えられ、この場合に
は、以後の対応をオペレータに対応させる方が利用者に
とって快適だからである。

【００７９】それゆえ、制御部１７が現時刻はオペレー
タの勤務時間内であることを確認した場合には、音声入
出力部１１を通じて電話５に対して『前回は失礼しまし
た。オペレータにお回しします。』との音声メッセージ
を応答し（Ｓ３８）、以後の通話をオペレータに転送す
る。

【００８０】現時刻はオペレータの勤務時間外である場
合、制御部１７は、上記発信者番号からの通話による音
声入力が過去に完了しているか否かを判定する（Ｓ３
６）。このような判定を行うのは、過去に音声入力を完
了している場合には、利用者は音声応答システム１の提
供するサービス内容や音声入力手順に習熟していると考
えられる一方、上記完了経験がない場合には、不案内な
利用者に各種利用情報を提供することが好ましいからで
ある。

【００８１】したがって、音声応答システム１は、上記
音声入力の完了履歴がある場合は直接に、上記音声入力
の完了履歴がない場合は利用情報の案内（Ｓ３９）を行
ってから、個人情報データの入力ステップにジャンプす
る。

【００８２】（４−２．個人情報データの入力ステッ
プ）図４は、個人情報データの入力ステップにおける音
声応答システム１の応答処理を説明するフローチャート
である。

【００８３】入力すべき個人情報データとしては、利用
者の住所，姓名，電話番号，郵便番号，業種，職業，生
年月日，家族構成，勤務先，年収，給料日，入社年月
日，保険区分，独身・既婚，希望連絡先，契約書受取方
法、希望融資額など様々な項目が考えられるが、ここで
は説明の便宜上、利用者に姓名，生年月日，性別，住
所，電話番号を順次音声入力させる場合の処理について
説明する。

【００８４】まず、音声応答システム１（ＩＶＲ４）の
制御部１７は、記憶部１８またはＤＢ３の格納データを
検索することにより、確定済の利用者の姓名が登録され
ているか否かを判定する（Ｓ４１）。具体的には、制御
部１７は、各種の前記利用者特定情報に基づいて利用者
を特定し、該利用者の確定済姓名データが記憶部１８ま
たはＤＢ３に格納されているか否かを判定する。

【００８５】上記判定の結果、確定済の利用者の姓名が
登録されていなければ、音声応答システム１は、利用者
に姓名データの音声入力を促すメッセージを提供して、
電話５から利用者の姓名入力を受け付ける。上記におい
て、確定済の利用者の姓名とは、利用者によって音声入
力した後に音声応答システム１と利用者との間で内容の
確認が行われた姓名データをいうが、その詳細について
は後述する。

【００８６】上記判定の結果、確定済の利用者の姓名が
登録されていれば、次のステップに進む。続いて、音声
応答システム１は、利用者の生年月日（Ｓ４２），性別
（Ｓ４３），住所（Ｓ４４），電話番号（Ｓ４５）につ
いて、Ｓ４１と同一の処理手順を繰り返すことにより、
全ての個人情報データについての音声入力受け付けを完
了する。

【００８７】すなわち、音声応答システム１は、個人情
報データのうち、既に入力・登録（格納）されている項
目については質問・入力を省略する一方、登録されてい
ない項目については、利用者に音声入力を促すようにメ
ッセージを提供することになる。なお、項目の省略に
は、前記既入力項目確認フラグを利用してもよい。

【００８８】また、音声応答システム１（ＩＶＲ４）の
制御部１７が個人情報データの一部、例えば利用者の姓
名データを利用者特定情報として採用する場合には、Ｓ
４１における姓名データの入力後に利用者を特定して、
入力済の項目（例えば、Ｓ４２における生年月日データ
やＳ４３における性別データ）の入力受け付けを適宜省
略してもよい。

【００８９】例えば、登録済項目が全く存在しない場合
における利用者と音声応答システム１との対話応答例を
示すと次のようになる。

【００９０】音声応答システム『姓名をおっしゃって
下さい。』（Ｓ４１）利用者『特許太郎です。』音声応答システム『姓名は、特許太郎さんですね』利用者『はい。』音声応答システム『ご住所をおっしゃって下さい。』
（Ｓ４２）利用者『○○県△△市××です。』音声応答システム『ご住所は○○県△△市××です
ね』利用者『はい。』音声応答システム『性別をおっしゃって下さい。』
（Ｓ４３）利用者『男性です。』音声応答システム『性別は男性ですね』利用者『はい。』（以下略）。

【００９１】（４−３．姓名データの入力受け付け例）
次に、図５を用いて、音声応答システム１が個人情報デ
ータの入力受け付けを行う場合の応答について、姓名デ
ータの入力受け付けを例にして説明する。

【００９２】まず、音声応答システム１は、電話５の利
用者に姓名の音声入力を促すメッセージとして『姓名を
おっしゃって下さい。』と発話する（Ｓ５１）。

【００９３】利用者は、上記メッセージを受けて自己の
姓名を例えば『特許太郎です。』のように音声入力する
（Ｓ５２）。

【００９４】音声応答システム１は、入力された音声を
ＩＶＲ４の音声認識部１２で認識することによりテキス
ト情報化した後、項目情報抽出部１３によって、該テキ
スト情報から姓名データを項目ごとに抽出する（Ｓ５
３）。例えば、姓名における姓部分と名前部分のように
個人情報データを更に小さな部分に分割できる場合に
は、データ管理の自由度向上を目的として、分割状態で
上記抽出を行うことも好ましい。

【００９５】続いて、音声応答システム１は、Ｓ５３に
おける姓名データの認識及び抽出が成功したか否かを判
定する（Ｓ５４）。例えばＩＶＲ４の制御部１７が記憶
部１８に格納される人名辞書と上記抽出結果とを対比す
ることによって、上記判定を行うことができる。上記判
定の結果、姓名データの認識に失敗した場合には、音声
応答システム１は、電話５の利用者に再入力を促すメッ
セージとして『申し訳ありませんが、もう一度お名前を
○○のようにおっしゃって下さい。』と発話して（Ｓ６
２）、Ｓ５２に戻る。

【００９６】姓名データの認識に成功した場合、音声応
答システム１は、Ｓ５３で認識した姓名データを記憶部
１８やＤＢ３に格納する（Ｓ５５）。図中の「確認無」
とは、上記姓名データの認識内容が正しいか否かは利用
者にまだ確認していない状態であることを示している。

【００９７】続いて、音声応答システム１は制御部１７
の制御によって、利用者に対し『お名前は、○○（特許
太郎さん）でよろしいですか』という確認メッセージを
発話する（Ｓ５６）。利用者は、上記メッセージを受け
て確認内容が適切な場合には『はい』を、確認内容が不
適切な場合には『いいえ』を発話する（Ｓ５７）。

【００９８】音声応答システム１（ＩＶＲ４）は、音声
認識部１２及び制御部１７によって、確認メッセージに
対する上記応答は認識結果が正しい（適切な）場合に対
応する『はい』であるか、間違っている（不適切な）場
合に対応する『いいえ』であるかを認識する（Ｓ５
８）。

【００９９】続いて、制御部１７は、Ｓ５８における利
用者の応答の認識に成功したか否かを判定する（Ｓ５
９）。この判定の結果、上記認識に失敗した場合には、
音声応答システム１は、電話５の利用者に再応答を促す
メッセージとして『申し訳ありませんが、はい、また
は、いいえ、とおっしゃって下さい。』と発話して（Ｓ
６３）、Ｓ５７に戻る。

【０１００】上記認識に成功したと判定した場合、制御
部１７は、認識結果が『はい』であったか否かを判定す
る（Ｓ６０）。上記認識結果が『はい』でなかった場合
には、音声応答システム１は姓名の入力受け付けに失敗
したものとして、最初のステップ（Ｓ５１）に戻る。

【０１０１】上記認識結果が『はい』であった場合に
は、音声応答システム１は、既に記憶部１８やＤＢ３に
格納された姓名データを正しいものとして確定する（Ｓ
６１）。例えば、格納された上記姓名データに内容確認
フラグを付しておく。

【０１０２】これにより、確定済の姓名データが音声応
答システム１に登録され、姓名データの入力受け付け処
理は終了する。

【０１０３】（５．補足）以上では、音声応答システム
１が利用者の金融貸付を受け付ける場合について説明し
たが、本発明の適用範囲はこれに限られるものではな
く、電話や無線などによる商品注文、アンケート、クイ
ズなど様々な用途に適用することができる。

【０１０４】また、本発明は、接続端末からの音声入力
を対話方式で受け付ける音声応答方法であって、上記接
続端末の利用者による音声入力の内容を認識するステッ
プと、上記音声入力内容の認識データから上記利用者の
個人情報データを抽出して格納するステップと、上記利
用者を特定する情報を取得するステップと、取得した上
記利用者特定情報に基づいて、個人情報データを構成す
る全項目のうち、既に入力済みの項目を判定するステッ
プと、上記利用者に、上記判定結果に対応するメッセー
ジを提供するステップとを備えることを特徴とする音声
応答方法と表現することもできる。

【０１０５】また、本実施形態で説明した音声応答シス
テム１及びＩＶＲ４での処理は、プログラムで実現する
ことが可能である。このプログラムはコンピュータで読
み取り可能な記録媒体に格納されている。本発明では、
この記録媒体として、記憶部１８またはＤＢ３であって
もよいし、ＩＶＲ４で処理が行われるために必要な図示
していないメモリ（例えばＲＯＭそのもの）であっても
よいし、また図示していないが外部記憶装置としてプロ
グラム読み取り装置が設けられ、そこに記録媒体を挿入
することで読み取り可能なプログラムメディアであって
もよい。

【０１０６】上記いずれの場合においても、格納されて
いるプログラムは、図略のマイクロプロセッサのアクセ
スにより実行される構成であってもよいし、格納されて
いるプログラムを読み出し、読み出したプログラムを図
示されていないプログラム記憶エリアにダウンロードす
ることにより、そのプログラムが実行される構成であっ
てもよい。この場合、ダウンロード用のプログラムは予
め本体装置に格納されているものとする。

【０１０７】ここで、上記プログラムメディアは、本体
と分離可能に構成される記録媒体であり、磁気テープや
カセットテープ等のテープ系、フロッピーディスクやハ
ードディスク等の磁気ディスクやＣＤ−ＲＯＭ／ＭＯ／
ＭＤ／ＤＶＤ等の光ディスクのディスク系、ＩＣカード
（メモリカードを含む）／光カード等のカード系、ある
いはマスクＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭ、フラッ
シュＲＯＭ等による半導体メモリを含めた固定的にプロ
グラムを担持する媒体であってもよい。

【０１０８】また、本実施形態におけるサーバコンピュ
ータ２がインターネットを含む通信ネットワークと接続
される場合は、通信ネットワークからプログラムをダウ
ンロードするように流動的にプログラムを担持する媒体
であってもよい。なお、このように通信ネットワークか
らプログラムをダウンロードする場合には、そのダウン
ロード用プログラムは予め本体装置に格納しておくか、
あるいは別な記録媒体からインストールされるものであ
ってもよい。

【０１０９】記録媒体に格納されている内容としてはプ
ログラムに限定されず、データであってもよい。

【０１１０】

【発明の効果】請求項１の発明に係る音声応答装置は、
以上のように、接続端末からの音声入力を対話方式で受
け付ける音声応答装置であって、上記接続端末の利用者
による音声入力の内容を認識する音声認識手段と、上記
音声認識手段の認識データから上記利用者の個人情報デ
ータを抽出して格納する個人情報データ格納手段と、上
記利用者を特定する情報を取得する利用者特定情報取得
手段と、上記利用者特定情報取得手段が取得した情報に
基づいて、個人情報データを構成する全項目のうち、既
に上記個人情報データ格納手段に格納されている項目を
判定する既入力情報判定手段と、上記利用者に、上記既
入力情報判定手段の判定結果に対応するメッセージを提
供するメッセージ提供手段とを備える構成である。

【０１１１】それゆえ、上記音声認識手段によって上記
接続端末から音声入力された内容が認識され、上記個人
情報データ格納手段によって該認識内容に含まれる利用
者の個人情報データが抽出及び格納される。一方、上記
既入力情報判定手段は、上記利用者特定情報取得手段の
取得した利用者特定情報に基づいて、個人情報データを
構成する全項目のうち、過去に入力が行われて既に上記
個人情報データ格納手段に格納されている項目を判定
し、この判定結果に基づいて、上記メッセージ提供手段
はメッセージを上記利用者に提供する。

【０１１２】これにより、自動応答に対する音声入力が
中断された場合であっても、円滑な再入力を可能とする
ことにより、利用者にとって快適な音声入力環境を実現
することができるという効果を奏する。

【０１１３】請求項２の発明に係る音声応答装置は、以
上のように、請求項１の構成において、上記メッセージ
提供手段は、上記個人情報データを構成する全項目から
上記既入力情報判定手段によって既入力と判定された項
目を省略して残る項目の音声入力を促すメッセージを提
供する構成である。

【０１１４】それゆえ、個人情報データを構成する全項
目のうち、既に入力及び格納されている項目については
入力が省略されるので、再入力時における重複入力が回
避される。

【０１１５】これにより、請求項１の効果に加えて、再
入力に要する時間を短縮することができるため、入力時
間や通信費用などの利用者負担を軽減することが可能に
なるという効果を奏する。

【０１１６】請求項３の発明に係る音声応答装置は、以
上のように、請求項１または２の構成において、上記利
用者特定情報取得手段は、上記利用者特定情報として、
上記個人情報データ格納手段が抽出した個人情報データ
の一部を取得する構成である。

【０１１７】それゆえ、上記利用者特定情報取得手段
は、上記個人情報データ格納手段が抽出した個人情報デ
ータの一部を上記利用者特定情報として利用する。

【０１１８】これにより、請求項１または２の効果に加
えて、入力された音声情報を有効活用しながら利用者の
特定を行うことができるため、音声応答装置の構成を簡
易なものとすることができるという効果を奏する。

【０１１９】請求項４の発明に係る音声応答装置は、以
上のように、請求項３の構成において、上記利用者特定
情報取得手段が取得する個人情報データは、利用者固有
のＩＤデータである構成である。

【０１２０】それゆえ、上記利用者特定情報取得手段
は、利用者固有のＩＤデータを上記利用者特定情報とし
て利用する。

【０１２１】これにより、請求項３の効果に加えて、確
実な利用者特定を行うことが可能になるという効果を奏
する。

【０１２２】請求項５の発明に係る音声応答装置は、以
上のように、請求項１乃至４のいずれか１項の構成にお
いて、上記利用者特定情報取得手段は、上記利用者特定
情報として、上記接続端末から入力される音声の周波数
情報を取得する構成である。

【０１２３】それゆえ、上記利用者特定情報取得手段は
上記接続端末から入力される音声の周波数情報、例えば
音声入力者の声紋データを利用者特定情報として利用す
る。

【０１２４】これにより、請求項１乃至４のいずれか１
項の効果に加えて、入力音声情報を有効活用しながら利
用者特定を行うことができるという効果を奏する。

【０１２５】請求項６の発明に係る音声応答装置は、以
上のように、請求項１乃至５のいずれか１項の構成にお
いて、上記接続端末は電話機であって、上記利用者特定
情報取得手段は、上記利用者特定情報として、上記電話
機の発信者番号を取得する構成である。

【０１２６】それゆえ、上記利用者特定情報取得手段
は、利用者の選択に応じて半自動的に音声応答装置に提
供される電話の発信者番号を利用者特定情報として利用
する。

【０１２７】これにより、請求項１乃至５のいずれか１
項の効果に加えて、利用者特定の確度を更に向上するこ
とができるという効果を奏する。

【０１２８】請求項７の発明に係る音声応答方法は、以
上のように、接続端末からの音声入力を対話方式で受け
付ける音声応答方法であって、上記接続端末の利用者に
よる音声入力の内容を認識するステップと、上記音声入
力内容の認識データから上記利用者の個人情報データを
抽出して格納するステップと、上記利用者を特定する情
報を取得するステップと、取得した上記利用者特定情報
に基づいて、個人情報データを構成する全項目のうち、
既に入力済みの項目を判定するステップと、上記利用者
に、上記判定結果に対応するメッセージを提供するステ
ップとを備える構成である。

【０１２９】それゆえ、音声認識ステップにおいて接続
端末から音声入力された個人情報データの内容が認識さ
れ、利用者特定情報取得ステップにおいて上記接続端末
の利用者を特定するための利用者特定情報が取得され
る。その後、既入力項目判定ステップにおいて、上記利
用者特定情報に基づいて上記利用者の個人情報データの
うち既に取得済みの項目が判定され、メッセージ提供ス
テップにおいて、上記判定結果に対応するメッセージが
利用者に提供される。

【０１３０】これにより、請求項１と同一の効果を奏す
ることができる。

【０１３１】請求項８の発明に係る音声応答プログラム
は、以上のように、接続端末からの音声入力を対話方式
で受け付ける音声応答を実行するためにコンピュータ
を、上記接続端末の利用者による音声入力の内容を認識
する音声認識手段と、上記音声認識手段の認識データか
ら上記利用者の個人情報データを抽出して格納する個人
情報データ格納手段と、上記利用者を特定する情報を取
得する利用者特定情報取得手段と、上記利用者特定情報
取得手段が取得した情報に基づいて、個人情報データを
構成する全項目のうち、既に上記個人情報データ格納手
段に格納されている項目を判定する既入力情報判定手段
と、上記利用者に、上記既入力情報判定手段の判定結果
に対応するメッセージを提供するメッセージ提供手段と
して機能させる構成である。

【０１３２】また、請求項９の発明に係るコンピュータ
読み取り可能な記録媒体は、請求項８に記載の音声応答
プログラムを記録した構成である。

【０１３３】これにより、上記音声応答プログラムをコ
ンピュータに実行させることによって、請求項１と同一
の効果を奏することができる。

【図面の簡単な説明】

【図１】本発明の実施の一形態に係る音声応答システム
（音声応答装置）の一部であるＩＶＲの概略構成を示す
ブロック図である。

【図２】上記音声応答システムの概略構成を示す説明図
である。

【図３】個人情報データの入力前における上記音声応答
システムの応答処理を説明するフローチャートである。

【図４】個人情報データの入力ステップにおける上記音
声応答システムの応答処理を説明するフローチャートで
ある。

【図５】姓名データの入力受け付け時における上記音声
応答システムの応答処理を説明するフローチャートであ
る。

【符号の説明】

１音声応答システム（音声応答装置）２サーバコンピュータ３ＤＢ４ＩＶＲ５電話（接続端末）１１音声入出力部１２音声認識部（音声認識手段）１３項目情報抽出部１４データ送受信部１５メッセージ選択部１６発話部１７制御部１８記憶部

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｇ１０Ｌ 15/00 Ｈ０４Ｍ 3/50 Ａ 15/28 Ｇ１０Ｌ 3/00 ５４５Ｄ 15/22 ５５１ＡＨ０４Ｍ 3/42 ５５１Ｐ 3/50 ５７１ＴＦターム(参考） 5B085 AE02 CE08 5D015 KK02 5K015 AA06 AA07 AD01 AD05 AF07 5K024 AA61 AA76 AA77 BB01 BB03 BB04 BB07 CC01 EE09 FF06 GG01 GG05

Claims

【特許請求の範囲】

【請求項１】接続端末からの音声入力を対話方式で受け
付ける音声応答装置であって、上記接続端末の利用者による音声入力の内容を認識する
音声認識手段と、上記音声認識手段の認識データから上記利用者の個人情
報データを抽出して格納する個人情報データ格納手段
と、上記利用者を特定する情報を取得する利用者特定情報取
得手段と、上記利用者特定情報取得手段が取得した情報に基づい
て、個人情報データを構成する全項目のうち、既に上記
個人情報データ格納手段に格納されている項目を判定す
る既入力情報判定手段と、上記利用者に、上記既入力情報判定手段の判定結果に対
応するメッセージを提供するメッセージ提供手段とを備
えることを特徴とする音声応答装置。
【請求項２】上記メッセージ提供手段は、上記個人情報
データを構成する全項目から上記既入力情報判定手段に
よって既入力と判定された項目を省略して残る項目の音
声入力を促すメッセージを提供することを特徴とする請
求項１に記載の音声応答装置。
【請求項３】上記利用者特定情報取得手段は、上記利用
者特定情報として、上記個人情報データ格納手段が抽出
した個人情報データの一部を取得することを特徴とする
請求項１または２に記載の音声応答装置。
【請求項４】上記利用者特定情報取得手段が取得する個
人情報データは、利用者固有のＩＤデータであることを
特徴とする請求項３に記載の音声応答装置。
【請求項５】上記利用者特定情報取得手段は、上記利用
者特定情報として、上記接続端末から入力される音声の
周波数情報を取得することを特徴とする請求項１乃至４
のいずれか１項に記載の音声応答装置。
【請求項６】上記接続端末は電話機であって、上記利用者特定情報取得手段は、上記利用者特定情報と
して、上記電話機の発信者番号を取得することを特徴と
する請求項１乃至５のいずれか１項に記載の音声応答装
置。
【請求項７】接続端末からの音声入力を対話方式で受け
付ける音声応答方法であって、上記接続端末の利用者による音声入力の内容を認識する
ステップと、上記音声入力内容の認識データから上記利用者の個人情
報データを抽出して格納するステップと、上記利用者を特定する情報を取得するステップと、取得した上記利用者特定情報に基づいて、個人情報デー
タを構成する全項目のうち、既に入力済みの項目を判定
するステップと、上記利用者に、上記判定結果に対応するメッセージを提
供するステップとを備えることを特徴とする音声応答方
法。
【請求項８】接続端末からの音声入力を対話方式で受け
付ける音声応答を実行するためにコンピュータを、上記接続端末の利用者による音声入力の内容を認識する
音声認識手段と、上記音声認識手段の認識データから上記利用者の個人情
報データを抽出して格納する個人情報データ格納手段
と、上記利用者を特定する情報を取得する利用者特定情報取
得手段と、上記利用者特定情報取得手段が取得した情報に基づい
て、個人情報データを構成する全項目のうち、既に上記
個人情報データ格納手段に格納されている項目を判定す
る既入力情報判定手段と、上記利用者に、上記既入力情報判定手段の判定結果に対
応するメッセージを提供するメッセージ提供手段として
機能させるための音声応答プログラム。
【請求項９】請求項８に記載の音声応答プログラムを記
録したことを特徴とするコンピュータ読み取り可能な記
録媒体。