JPWO2014024751A1

JPWO2014024751A1 - 音声応答装置

Info

Publication number: JPWO2014024751A1
Application number: JP2014529447A
Authority: JP
Inventors: 健純近藤; 豪生野澤; 謙史竹中; 健司水野; 博司前川; 毅川西; 林　茂; 茂林; 辰美黒田
Original assignee: ADC Technology Inc
Current assignee: ADC Technology Inc
Priority date: 2012-08-10
Filing date: 2013-07-31
Publication date: 2016-07-25
Also published as: JP2020194184A; JP2018036653A; JP2019049742A; WO2014024751A1

Abstract

入力された音声に対する応答を音声で行わせる音声応答装置であって、入力された音声の特徴を記録する音声特徴記録部と、入力された音声の特徴が以前に前記音声特徴記録部により記録された音声の特徴と一致するか否かを判定する音声一致判定部と、前記音声一致判定部により音声の特徴が一致しないと判定された場合、音声の特徴が一致すると判定された場合とは異なる応答を出力させる音声出力部と、を備える。

Description

関連出願の相互参照

本国際出願は、２０１２年８月１０日に日本国特許庁に出願された日本国特許出願第２０１２−１７８４５４号に基づく優先権を主張するものであり、日本国特許出願第２０１２−１７８４５４号の全内容を参照により本国際出願に援用する。

本発明は、入力された音声に対する応答を音声で行わせる音声応答装置に関する。

上記の音声応答装置として、入力された質問に対する回答を辞書から検索し、検索した回答を音声で出力するものが知られている（例えば特許文献１参照）。また、使用者との対話の内容に基づいて質問に対する回答を生成する技術も知られている（例えば特許文献２参照）。

特許第４８３２０９７号公報特許第４９２４９５０号公報

上記技術では、単に１つの質問に対して辞書によって特定される１つの回答を行うように設定されている。
入力された音声に対する応答を音声で行わせる音声応答装置において、使用者にとってより使い勝手をよくすることが本発明の一側面である。

第１局面の発明は、
入力された音声に対する応答を音声で行わせる音声応答装置であって、
入力された音声の特徴を記録する音声特徴記録部と、
入力された音声の特徴が以前に前記音声特徴記録部により記録された音声の特徴と一致するか否かを判定する音声一致判定部と、
前記音声一致判定部により音声の特徴が一致しないと判定された場合、音声の特徴が一致すると判定された場合とは異なる応答を出力させる音声出力部と、
を備えたことを特徴とする。

このような音声応答装置によれば、音声を入力した人物が以前と異なる場合には、音声を入力した人物が以前と同様の場合とは異なる応答を返すことができる。よって、音声を入力した人物が以前と同じか否かに拘わらず同様の回答をする場合と比較して、使用者にとってより使い勝手をよくすることができる。

ところで、上記音声応答装置においては、第２局面の発明のように、
入力された音声の特徴に基づいて音声を入力した人物を特定する人物特定部と、
入力された音声に従って被制御部を制御する制御部と、を備え、
前記制御部は、異なる人物から矛盾する指示を受けると予め人物毎に設定された優先順位に従って前記優先順位の上位の者による指示を優先して制御を実施するようにしてもよい。

このような音声応答装置によれば、異なる人物から矛盾する指示を受けた場合であったとしても、優先順位に従って被制御部に対する制御を実施することができる。
なお、矛盾する指示を受けた場合に、音声による応答で矛盾を指摘する、或いは、代替案を提示するようにしてもよい。この際、代替案を提示する場合には、天候などを加味した応答を出力してもよい。

さらに、上記音声応答装置においては、第３局面の発明のように、
入力された音声の特徴に基づいて音声を入力した人物を特定する人物特定部と、
入力された音声に基づくスケジュールを前記人物毎に記録するスケジュール記録部と、を備えていてもよい。

このような音声応答装置によれば、人物毎にスケジュールを管理することができる。
なお、本発明において人物特定部を除き、スケジュール記録部を第２局面に係る発明に従属させることができる。また、本発明においては、予定の属性に応じて予定の優先度を変更してもよい。予定の属性とは、例えば、変更できるか否か（相手への影響があるかどうか）などによって区分される。

予定属性によって先に登録されたスケジュールを変更したり、後から登録されるスケジュールを空いている時間に登録したりすればよい。また、スケジュールを登録する際には、前のスケジュールの場所と後のスケジュールの場所とを考慮し、これらの間を移動するための時間を検索し、これらの間を移動するための移動時間を考慮して後から登録されるスケジュールを登録するようにしてもよい。

また、当該装置が管理する複数の人物が打ち合わせを行う場合のように、同じスケジュール（予定が実施される時間帯）を複数の人物が共有する場合には、これらの複数の人物のスケジュールが空いている時間帯を検索し、この時間に打ち合わせを設定するようにしてもよい。また、空いている時間帯がない場合には、予定属性に応じて既に登録されているスケジュールを変更するようにしてもよい。

このようにスケジュールを変更する際には、その旨を音声の応答として出力することが好ましい。
また、上記音声応答装置においては、第４局面の発明のように、入力された音声が聞き取れない場合（つまり、文字に変換したときに文章として誤りがあると推定できる場合）に所定の連絡先に問い合わせるようにしてもよい。この際、位置情報を利用して問い合わせ元や問い合わせ先を特定するようにしてもよい。

このような音声応答装置によれば、例えば、子供が話す内容が聞き取れない場合、母親に問い合わせることや、老人が話す内容が聞き取れない場合、その老人の家族に問い合わせることによって、正しい内容を他の者から入力させることができるので、入力された音声の正確性に担保することができる。

さらに、上記音声応答装置においては、第５局面の発明のように、予め使用者（音声を入力した者）の年齢または年齢層を示す年齢情報に応じて準備された複数のデータベースを備えておき、使用者の年齢情報に従って使用するデータベースを選択し、この選択したデータベースに従って音声を認識するようにしてもよい。

このような音声応答装置によれば、年齢に応じて音声認識の際に参照するデータベースを変更するので、年齢に応じて使用頻度が高い単語、言葉の言い回しなどを登録しておけば、音声認識の精度を向上させることができる。

また、上記音声応答装置においては、第６局面の発明のように、使用者（音声を入力した者）の年齢を推定し、推定した年齢を年齢情報として利用してもよい。
使用者の年齢を推定する際には、例えば、入力された音声の特徴（声の波形、声の高さ等）に応じて推定してもよいし、使用者が音声を入力する際にカメラ等の撮像部によって使用者の顔を撮像することによって推定してもよい。

また、使用者の顔を撮像する際には、使用者の識別や年齢認証を行ってもよい。
さらに、現金自動支払機等の対面型の装置に本発明を適用してもよい。この場合、本発明を用いて年齢の認証などの本人確認を行うことができる。

また、本発明を車両に適用してもよい。この場合、人物を特定する構成を車両の鍵に代わる構成として利用することができる。
なお、上記発明は音声応答装置として説明したが、入力された音声を認識する構成を備えた音声認識装置として構成してもよい。また、各局面の発明は、他の発明を前提とする必要はなく、可能な限り独立した発明とすることができる。

本発明が適用された音声応答システムの概略構成を示すブロック図である。端末装置の概略構成を示すブロック図である。端末装置のＭＰＵが実行する音声応答端末処理を示すフローチャートである。サーバの演算部が実行する音声応答サーバ処理（その１）を示すフローチャートである。音声応答サーバ処理（その２）を示すフローチャートである。図６Ａは、音声認識ＤＢを示す説明図である。図６Ｂは、優先順位ＤＢを示す説明図である。音声応答サーバ処理のうちのスケジュール入力処理を示すフローチャートである。スケジュールＤＢに記録されたスケジュールの一例を示す説明図である。予定属性の一例を示す説明図である。音声応答サーバ処理のうちの操作入力処理を示すフローチャートである。音声応答サーバ処理のうちの変更確認処理を示すフローチャートである。音声応答サーバ処理のうちの期間指定処理を示すフローチャートである。変形例の操作入力処理を示すフローチャートである。

１…端末装置、１０…行動センサユニット、１１…３次元加速度センサ、１３…３軸ジャイロセンサ、１５…温度センサ、１７…湿度センサ、１９…温度センサ、２１…湿度センサ、２３…照度センサ、２５…濡れセンサ、２７…ＧＰＳ受信機、２９…風速センサ、３３…心電センサ、３５…心音センサ、３７…マイク、３９…メモリ、４１…カメラ、５０…通信部、５３…無線電話ユニット、５５…連絡先メモリ、６０…報知部、６１…ディスプレイ、６３…電飾、６５…スピーカ、７０…操作部、７１…タッチパッド、７３…確認ボタン、７５…指紋センサ、７７…救援依頼レバー、８０…通信基地局、８５…インターネット網、９０…サーバ、９５…被制御部、１００…音声応答システム、１０１…演算部。

以下に本発明にかかる実施の形態を図面と共に説明する。
［本実施形態の構成］
本発明が適用された音声応答システム１００は、端末装置１において入力された音声に対して、サーバ９０にて適切な応答を生成し、端末装置１で応答を音声で出力するよう構成されたシステムである。また、入力された音声に指令が含まれている場合に、対象となる装置（被制御部９５）に対して制御指令を出力する。さらに、使用者のスケジュールを管理する機能も有する。

詳細には、図１に示すように、音声応答システム１００は、複数の端末装置１や車両に搭載されたエアコン等の各種機器（被制御部９５）とサーバ９０とが通信基地局８０、８１やインターネット網８５を介して互いに通信可能に構成されている。なお、端末装置１は他の端末装置１や被制御部９５と直接通信を行うよう構成されていてもよい。

サーバ９０は、通常のサーバ装置としての機能を備えている。特にサーバ９０は、演算部１０１と、各種データベース（ＤＢ）とを備えている。演算部１０１は、ＣＰＵと、ＲＯＭ、ＲＡＭ等のメモリを備えた周知の演算装置として構成されており、メモリ内のプログラムに基づいて、インターネット網８５を介した端末装置１等との通信や、各種ＤＢ内のデータの読み書き、或いは、端末装置１を利用する使用者との会話を行うための音声認識や応答生成といった各種処理を実施する。

各種ＤＢとしては、図１に示すように、音声認識ＤＢ１０２、予測変換ＤＢ１０３、音声ＤＢ１０４、応答候補ＤＢ１０５、性格ＤＢ１０６、学習ＤＢ１０７、嗜好ＤＢ１０８、ニュースＤＢ１０９、天気ＤＢ１１０、優先順位ＤＢ１１１、スケジュールＤＢ１１２、端末情報ＤＢ１１３、感情判定ＤＢ１１４、健康判定ＤＢ１１５、通報先ＤＢ１１７等を備えている。なお、これらのＤＢの詳細については、処理の説明の都度述べることにする。

次に、端末装置１は、図２に示すように、行動センサユニット１０と、通信部５０と、報知部６０と、操作部７０と、が所定の筐体に備えられて構成されている。
行動センサユニット１０は、周知のＭＰＵ３１（マイクロプロセッサユニット）、ＲＯＭ、ＲＡＭ等のメモリ３９、および各種センサを備えており、ＭＰＵ３１は各種センサを構成するセンサ素子が検査対象（湿度、風速等）を良好に検出することができるように、例えば、センサ素子の温度に最適化するためのヒータを駆動させる等の処理を行う。

行動センサユニット１０は、各種センサとして、３次元加速度センサ１１（３ＤＧセンサ）と、３軸ジャイロセンサ１３と、筐体の背面に配置された温度センサ１５と、筐体の背面に配置された湿度センサ１７と、筐体の正面に配置された温度センサ１９と、筐体の正面に配置された湿度センサ２１と、筐体の正面に配置された照度センサ２３と、筐体の背面に配置された濡れセンサ２５と、端末装置１の現在地を検出するＧＰＳ受信機２７と、風速センサ２９とを備えている。

また、行動センサユニット１０は、各種センサとして、心電センサ３３、心音センサ３５、マイク３７、カメラ４１も備えている。なお、各温度センサ１５，１９、および各湿度センサ１７，２１は、筐体の外部空気の温度または湿度を検査対象として測定を行う。

３次元加速度センサ１１は、端末装置１に加えられる互いに直交する３方向（鉛直方向（Ｚ方向）、筐体の幅方向（Ｙ方向）、および筐体の厚み方向（Ｘ方向））における加速度を検出し、この検出結果を出力する。

３軸ジャイロセンサ１３は、端末装置１に加えられる角速度として、鉛直方向（Ｚ方向）と、該鉛直方向とは直交する任意の２方向（筐体の幅方向（Ｙ方向）、および筐体の厚み方向（Ｘ方向））における角加速度（各方向における左回りの各速度を正とする）を検出し、この検出結果を出力する。

温度センサ１５，１９は、例えば温度に応じて電気抵抗が変化するサーミスタ素子を備えて構成されている。なお、本実施例においては、温度センサ１５，１９は摂氏温度を検出し、以下の説明に記載する温度表示は全て摂氏温度で行うものとする。

湿度センサ１７，２１は、例えば周知の高分子膜湿度センサとして構成されている。この高分子膜湿度センサは、相対湿度の変化に応じて高分子膜に含まれる水分の量が変化し、誘電率が変化するコンデンサとして構成されている。

照度センサ２３は、例えばフォトトランジスタを備えた周知の照度センサとして構成されている。
風速センサ２９は、例えば周知の風速センサであって、ヒータ温度を所定温度に維持する際に必要な電力（放熱量）から風速を算出する。

心音センサ３５は、使用者の心臓の拍動による振動を捉える振動センサとして構成されており、ＭＰＵ３１は心音センサ３５による検出結果とマイク３７から入力される心音とを鑑みて、拍動による振動や騒音と、他の振動や騒音とを識別する。

濡れセンサ２５は筐体表面の水滴を検出し、心電センサ３３は使用者の鼓動を検出する。
カメラ４１は、端末装置１の筐体内において、端末装置１の外部を撮像範囲とするように配置されている。特に、本実施形態においては、端末装置１の使用者を撮像可能な位置にカメラ４１が配置されている。

通信部５０は、周知のＭＰＵ５１と、無線電話ユニット５３と、連絡先メモリ５５と、を備え、図示しない入出力インターフェイスを介して行動センサユニット１０を構成する各種センサからの検出信号を取得可能に構成されている。そして、通信部５０のＭＰＵ５１は、この行動センサユニット１０による検出結果や、操作部７０を介して入力される入力信号、ＲＯＭ（図示省略）に格納されたプログラムに応じた処理を実行する。

具体的には、通信部５０のＭＰＵ５１は、使用者が行う特定の動作を検出する動作検出装置としての機能、使用者との位置関係を検出する位置関係検出装置としての機能、使用者により行われる運動の負荷を検出する運動負荷検出装置としての機能、およびＭＰＵ５１による処理結果を送信する機能を実行する。

無線電話ユニット５３は、例えば携帯電話の基地局と通信可能に構成されており、通信部５０のＭＰＵ５１は、該ＭＰＵ５１による処理結果を報知部６０に対して出力したり、無線電話ユニット５３を介して予め設定された送信先（連絡先メモリ５５に記録された連絡先）に対して送信したりする。

連絡先メモリ５５は、使用者の訪問先の位置情報を記憶するための記憶領域として機能する。この連絡先メモリ５５には、使用者に異常が生じた場合に連絡をすべき連絡先（電話番号など）の情報が記録されている。

報知部６０は、例えば、ＬＣＤや有機ＥＬディスプレイとして構成されたディスプレイ６１と、例えば７色に発光可能なＬＥＤからなる電飾６３と、スピーカ６５とを備えている。報知部６０を構成する各部は、通信部５０のＭＰＵ５１により駆動制御される。

次に、操作部７０としては、タッチパッド７１と、確認ボタン７３と、指紋センサ７５と、救援依頼レバー７７とを備えている。
タッチパッド７１は、使用者（使用者や使用者の保護者等）により触れられた位置や圧力に応じた信号を出力する。

確認ボタン７３は、使用者に押下されると内蔵されたスイッチの接点が閉じるように構成されており、通信部５０にて確認ボタン７３が押下されたことを検出することができるようにされている。

指紋センサ７５は、周知の指紋センサであって、例えば、光学式センサを用いて指紋を読みとることができるよう構成されている。なお、指紋センサ７５に換えて、例えば掌の静脈の形状を認識するセンサ等、人間の身体的特徴を認識することができる手段（バイオメトリクス認証をすることができる手段：個人を特定することができる手段）であれば、採用することができる。

また、操作されると所定の連絡先に接続される救援依頼レバー７７も備えている。
［本実施形態の処理］
このような音声応答システム１００において実施される処理について以下に説明する。

端末装置１にて実施される音声応答端末処理は、使用者による音声入力を受付けてこの音声をサーバ９０に送り、サーバ９０から出力すべき応答を受けるとこの応答を音声で再生する処理である。なお、この処理は、使用者が操作部７０を介して音声入力を行う旨を入力すると開始される。

詳細には、図３に示すように、まず、マイク３７からの入力を受け付ける状態（ＯＮ状態）とし（Ｓ２）、カメラ４１による撮像（録画）を開始する（Ｓ４）。そして、音声入力があったか否かを判定する（Ｓ６）。

音声入力がなければ（Ｓ６：ＮＯ）、タイムアウトしたか否かを判定する（Ｓ８）。ここで、タイムアウトとは、処理を待機する際の許容時間を超えたことを示し、ここでは許容時間は例えば５秒程度に設定される。

タイムアウトしていれば（Ｓ８：ＹＥＳ）、後述するＳ３０の処理に移行する。また、タイムアウトしていなければ（Ｓ８：ＮＯ）、Ｓ６の処理に戻る。
音声入力があれば（Ｓ６：ＹＥＳ）、音声をメモリに記録し（Ｓ１０）、音声の入力が終了したか否かを判定する（Ｓ１２）。ここでは、音声が一定時間以上途切れた場合や、操作部７０を介して音声入力を終了する旨が入力された場合に、音声の入力が終了したと判定する。

音声の入力が終了していなければ（Ｓ１２：ＮＯ）、Ｓ１０の処理に戻る。また、音声の入力が終了していれば（Ｓ１２：ＹＥＳ）、自身を特定するためのＩＤ、音声、および撮像画像等のデータをサーバ９０に対してパケット送信する（Ｓ１４）。なお、データを送信する処理は、Ｓ１０とＳ１２の間で行ってもよい。

続いて、データの送信が完了したか否かを判定する（Ｓ１６）。送信が完了していなければ（Ｓ１６：ＮＯ）、Ｓ１４の処理に戻る。
また、送信が完了していれば（Ｓ１６：ＹＥＳ）、後述する音声応答サーバ処理にて送信されるデータ（パケット）を受信したか否かを判定する（Ｓ１８）。データを受信していなければ（Ｓ１８：ＮＯ）、タイムアウトしたか否かを判定する（Ｓ２０）。

タイムアウトしていれば（Ｓ２０：ＹＥＳ）、後述するＳ３０の処理に移行する。また、タイムアウトしていなければ（Ｓ２０：ＮＯ）、Ｓ１８の処理に戻る。
また、データを受信していれば（Ｓ１８：ＹＥＳ）、パケットを受信する（Ｓ２２）。この処理では、文字情報に対する応答を取得する。

そして、受信が完了したか否かを判定する（Ｓ２４）。受信が完了していなければ（Ｓ２４：ＮＯ）、タイムアウトしたか否かを判定する（Ｓ２６）。
タイムアウトしていれば（Ｓ２６：ＹＥＳ）、エラーが発生した旨を報知部６０を介して出力し、音声応答端末処理を終了する。また、タイムアウトしていなければ（Ｓ２６：ＮＯ）、Ｓ２２の処理に戻る。

また、受信が完了していれば（Ｓ２４：ＹＥＳ）、受信したパケットに基づく応答を音声でスピーカ６５から出力させる（Ｓ２８）。このような処理が終了すると、音声応答端末処理を終了する。

続いて、サーバ９０（外部装置）にて実施される音声応答サーバ処理について図４を用いて説明する。音声応答サーバ処理は、端末装置１から音声を受信し、この音声を文字情報に変換する音声認識を行うとともに、音声に対する応答を生成して端末装置１に返す処理である。

音声応答サーバ処理の詳細としては、図４（および図５）に示すように、まず、何れかの端末装置１からのパケットを受信したか否かを判定する（Ｓ４２）。パケットを受信していなければ（Ｓ４２：ＮＯ）、Ｓ４２の処理を繰り返す。

また、パケットを受信していれば（Ｓ４２：ＹＥＳ）、通信相手の端末装置１を特定する（Ｓ４４）。この処理では、パケットに含まれる端末装置１のＩＤによって端末装置１を特定する。

続いて、パケットに含まれるカメラ４１による撮像画像を取得し（Ｓ７０）、パケットに含まれる音声の特徴を検出する（Ｓ７２）。この処理では、音声波形の特徴（声紋）や音の高低などの特徴を検出する。

続いて、使用者を撮像した撮像画像や音声の特徴から音声を入力した者の年齢層を特定する（Ｓ７４）。この処理では、音声の特徴と年齢層との傾向を予め音声認識ＤＢ１０２に格納しておき、この音声認識ＤＢ１０２を参照することで年齢層を特定する。また、撮像画像から使用者の年齢を推定する周知の技術を併用する。

次に、これらの音声の特徴から人物を特定する（Ｓ７６）。ここで、音声認識ＤＢ１０２には、人物毎の音声の特徴が人物の名前と対応して予め記憶されており、この処理では、この音声認識ＤＢ１０２を参照することによって人物を特定する。

なお、各人物の音声の特徴を記録する際には、例えば、名前のみを音声や文字で使用者に入力させ、名前が入力されたときや、その後の音声入力のときに、音声特徴を捉えて記録するようにすればよい。また、画像による本人認証の技術を本実施形態において併用してもよい。

続いて、この音声や検出した音声特徴を音声認識ＤＢ１０２に記録し（Ｓ７８）、音声認識を行う際に利用するデータベースを選択する（Ｓ８０）。ここで、音声認識ＤＢ１０２には、図６Ａに示すように、４歳までを対象にした幼児ＤＢ、５歳から１０歳までを対象とした子供ＤＢ、１０代（１０歳〜１９歳）を対象とした若年ＤＢ、２０代（２０歳〜２９歳）を対象とした青年ＤＢ、３０〜５０代（３０歳〜５９歳）を対象とした中年ＤＢ、６０代以上を対象として壮年ＤＢを備えている。

各ＤＢには、音声を文字として認識するための、音声の波形と文字（音または単語）とを対応付ける辞書データベースを備えている。そして、各ＤＢでは、年齢層毎に、使用者の喋り方（音声特徴の傾向）や、年齢層に使用される傾向がある単語などが、異なる情報として記録されている。

特に、各ＤＢは、若い年齢ほど使用される年齢幅が狭く設定されている。このようにしているのは、若い年齢ほど喋り方の変化や、新たな単語の創造能力が高く、これらの変化に直ちに対応できるようにするためである。

Ｓ８０の処理では、推定した使用者の年齢に応じて年齢層に合致する１つのデータベース（図６Ａに示すもののうちの何れか）を選択し、設定する。続いて、パケットに含まれる音声を認識する（Ｓ４６）。

ここで、予測変換ＤＢ１０３には、ある単語に続いて利用されがちな単語が対応付けられている。この処理では、音声認識ＤＢ１０２のうちの選択されたデータベースおよび予測変換ＤＢ１０３を参照することで、周知の音声認識処理を実施し、音声を文字情報に変換する。

続いて、撮像画像を画像処理することによって、撮像画像中の物体を特定する（Ｓ４８）。そして、音声の波形や言葉の語尾などに基づいて、使用者の感情を判定する（Ｓ５０）。

この処理では、音声の波形（声色）や言葉の語尾などと、通常、怒り、喜び、困惑、悲しみ、高揚などの感情の区分とが対応付けられた感情判定ＤＢ１１４を参照することによって、使用者の感情が何れかの区分に該当するかを判定し、この判定結果をメモリに記録する。続いて、学習ＤＢ１０７を参照することによって、この使用者がよく話す単語を検索し、音声認識にて生成した文字情報が曖昧であった部位を補正する。

なお、学習ＤＢ１０７には、使用者がよく話す単語や発音時の癖など、使用者の特徴が使用者ごとに記録されている。また、使用者との会話において学習ＤＢ１０７へのデータの追加・修正がなされる。また、予測変換ＤＢ１０３、感情判定ＤＢ１０４等においても、音声認識ＤＢ１０２同様に、年齢層毎に区分してデータを保持してもよい。

続いて、補正後の文字情報を入力された文字情報として特定する（Ｓ５４）。そして、これらの処理の結果、音声を文字情報として認識できたか否かを判定する（Ｓ８２）。
この処理では、文章として不具合がある場合（例えば、文法的に誤りがある場合など）には、文章が完成していたとしても認識できなかったものとみなす。文字情報として認識できていなければ（Ｓ８２：ＮＯ）、予め通報先ＤＢ１１７に登録された所定の連絡先（端末装置１毎に設定された連絡先）に、所定の音声（例えば、「以下の言葉が認識できませんでした。録音した音声を再生しますので、正しい文章をお話しください。」といった文章）と、使用者が入力した音声とを送信することで、問い合わせを行う（Ｓ８４）。

この処理は、例えば滑舌の悪い子供が使用者となる場合に、文字情報として認識できない場合、所定の連絡先として登録された母親の端末装置１に問い合わせをしたり、老人が使用者となる場合に、その家族に問い合わせをしたりする。

続いて、問い合わせ先によって音声が入力されたパケットを受信したか否かを判定する（Ｓ８６）。パケットを受信していなければ（Ｓ８６：ＮＯ）、この処理を繰り返す。また、パケットを受信していれば（Ｓ８６：ＹＥＳ）、Ｓ５４の処理に戻る。

さらに、Ｓ８２の処理にて、文字情報として認識できていれば（Ｓ８２：ＹＥＳ）、文字情報がスケジュールを入力するものであるか否かを判定する（Ｓ８８）。スケジュールを入力するものでなければ（Ｓ８８：ＮＯ）、後述するＳ９２の処理に移行する。

また、スケジュールを入力するものであれば（Ｓ８８：ＹＥＳ）、スケジュールの管理を行うスケジュール入力処理を実施する（Ｓ９０）。この処理では、図７に示すように、まず、スケジュールを入力する対象となる特定人物のスケジュールを抽出する（Ｓ１０２）。

この処理では、図８に示すように、特定人物と時刻とがマトリクス状に配置されたスケジュールデータをスケジュールＤＢ１１２から抽出し（Ｓ１０２）、入力された予定（時間帯、予定の内容、場所の情報を含むもの）を仮登録する（Ｓ１０４）。

続いて、スケジュール（予定）に競合があるか否かを判定する（Ｓ１０６）。例えば、Ａ氏については図８に示すように９月１日の１０時から会議の予定が既に登録されているが、この同じ時間に別の予定を入れるよう指示があった場合には、競合ありとして判定する。

競合があれば（Ｓ１０６：ＹＥＳ）、後述するＳ１２８の処理に移行する。また、競合がなければ（Ｓ１０６：ＮＯ）、前後の予定について、予定が実施される場所を抽出する（Ｓ１０８）。

続いて、前後の予定が実施される時間と場所とを鑑みて、仮登録した予定が実施される場所に移動するまでの移動時間を算出する（Ｓ１１０）。この処理では、例えば周知の乗換案内プログラムを利用して、移動に必要な時間を演算する。例えば、東京の丸の内から名古屋まで移動するには、約２時間の移動時間を必要とされる。

続いて、仮登録された予定が実施される場所と、前後の予定が実施される場所との移動が可能か否かを判定する（Ｓ１２２）。この処理では、移動に要する時間と空き時間の長さとを比較し、空き時間が長ければ移動可とする。

移動が可能であれば（Ｓ１２２：ＹＥＳ）、この予定をスケジュールＤＢ１１２に本登録し（Ｓ１２４）、登録完了した旨を記録し（Ｓ１２６）、スケジュール入力処理を終了する。

また、移動が不可能であれば（Ｓ１２２：ＮＯ）、前後の予定または仮登録した予定を変更可能か否かを判定する（Ｓ１２８）。ここで、スケジュールＤＢ１１２に記録される各予定には、予定属性が設定されており、予定属性は、図９に示すように、重要度に応じたレベルが設定されている。例えば、レベルＡには、客先とのアポイント（面会の約束）が対応し、予定の変更は不可とされる。

また、レベルＢには、客先以外の例えば社内でのアポイントが対応し、予定の変更は不可とされる。また、レベルＣには、私的な用事が対応し、予定の変更が可能とされる。
ここで、本処理では、予定について登録する際（Ｓ１２４の処理の際）には、その内容から予定属性を認識し、予定属性についても登録する。また、仮登録された予定についてはこの処理において予定属性を認識する。

前後の予定または仮登録した予定を変更可能であれば（Ｓ１２８：ＹＥＳ）、変更案を提示する（Ｓ１３０）。ここで、変更案とは、変更可能な予定（つまりレベルＣに属する予定）を移動させ、競合がなくかつ予定が実施される場所間で使用者（対象者）が移動可能になるような案を提示する。

そして、変更フラグをＯＮに設定し（Ｓ１３２）、スケジュール入力処理を終了する。
また、前後の予定または仮登録した予定を変更可能でなければ（Ｓ１２８：ＮＯ）、予定が重複した旨を記録し（Ｓ１３４）、スケジュール入力処理を終了する。

このようなスケジュール入力処理が終了すると、図５に戻り、文字情報が被制御部９５を操作するための指令である操作入力であるか否かを判定する（Ｓ９２）。操作入力でなければ（Ｓ９２：ＮＯ）、後述するＳ９６の処理に移行する。

また、操作入力であれば（Ｓ９２：ＹＥＳ）、操作入力処理を実施する（Ｓ９４）。この処理は、入力された音声に従って被制御部９５の作動を制御する処理である。詳細には、図１０に示すように、まず、指令内容を認識する（Ｓ２０２）。指令内容としては、例えば、被制御部９５に該当するテレビ受像器の受信チャンネルや音量を変更することや、被制御部９５に該当する車両のエアコンの設定温度を１℃高くする、等が該当する。

続いて、同じ被制御部９５に対する過去の指令（例えば過去所定時間（１０分以内など）のもの）があったか否かを判定する（Ｓ２０４）。同じ被制御部９５に対する過去の指令がなければ（Ｓ２０４：ＮＯ）、後述するＳ２１６の処理に移行する。

また、同じ被制御部９５に対する過去の指令があれば（Ｓ２０４：ＹＥＳ）、この過去の指令を抽出し（Ｓ２０６）、過去の指令との矛盾があるか否かを判定する（Ｓ２０８）。ここで、矛盾とは、例えば、被制御部９５に車両のエアコンが該当する場合、設定温度を１℃低くする、という過去の指令があったのに対して、これに相反する、車両のエアコンの設定温度を１℃高くする、という指令が入力された場合等が該当する。

また、例えば、被制御部９５にテレビ受像器が該当する場合、受信チャンネルを変更した直後に、他の受信チャンネルに変更する指令を受けた場合や、音量を変更した直後に、さらに音量を変更する指令が入力された場合等が該当する。

矛盾がなければ（Ｓ２０８：ＮＯ）、Ｓ２１６の処理に移行する。また、矛盾があった場合には（Ｓ２０８：ＹＥＳ）、矛盾する指令を入力した者が一致するか否かを判定する（Ｓ２１０）。矛盾する指令を入力した者が一致しない場合には（Ｓ２１０：ＮＯ）、これらの矛盾する指令を入力した者についての優先順位を取得する（Ｓ２１２）。

ここで、優先順位ＤＢ１１１には、図６Ｂに示すように、人物と優先順位とが対応付けて記録されている。例えば、Ａ氏とＢ氏とが矛盾する指令をそれぞれ入力した場合には、Ａ氏の１位とＢ氏の４位とが優先順位ＤＢ１１１から取得される。

続いて、優先順位が最も高いものからの指令を設定する。例えば、優先順位が１位のＡ氏が「車両のエアコンの設定温度を１℃高くする」旨を指令し、優先順位が４位のＢ氏が「車両のエアコンの設定温度を１℃低くする」旨を指令した場合には、Ａ氏の指令が適用され、Ｂ氏の指令は無効になる。

そして、設定された指令を被制御部９５に送信し（Ｓ２１８）、操作入力処理を終了する。また、Ｓ２１０の処理にて、矛盾する指令を入力した者が一致する場合には（Ｓ２１０：ＹＥＳ）、直近に入力された指令を設定し（Ｓ２１６）、前述のＳ２１８の処理を実施し、操作入力処理を終了する。

このような操作入力処理が終了すると、図５に戻り、変更フラグがＯＮに設定されているか否かを判定する（Ｓ９６）。変更フラグがＯＦＦであれば（Ｓ９６：ＮＯ）、後述するＳ５６の処理に移行する。

また、変更フラグがＯＮであれば（Ｓ９６：ＹＥＳ）、変更確認処理を実施する（Ｓ９８）。変更確認処理は、スケジュールの変更案を提示した際に、提示した変更案のようにスケジュールを変更してもよいか、使用者の意思を確認する処理である。

変更確認処理では、図１１に示すように、まず、変更案に対する回答があったか否かを判定する（Ｓ４０２）。変更案に対する回答がなければ（Ｓ４０２：ＮＯ）、本予定についての登録が完了したか否かを判定する（Ｓ４０４）。つまり、使用者自身が予定の入力をやり直すなどして、登録が完了しているかどうかを判定する。

本予定についての登録が完了していれば（Ｓ４０４：ＹＥＳ）、変更フラグをＯＦＦに設定し（Ｓ４１２）、変更確認処理を終了する。また、本予定についての登録が完了していれば（Ｓ４０４：ＮＯ）、変更確認処理を終了する。

また、Ｓ４０２の処理において、変更案に対する回答があれば（Ｓ４０２：ＹＥＳ）、例えば、「それでいいよ」など、変更案通りでよい旨の回答が得られたか否かを判定する（Ｓ４０６）。変更案通りでよい旨の回答が得られていれば（Ｓ４０６：ＹＥＳ）、提示した変更案をスケジュールとして登録し（Ｓ４０８）、登録完了を記録する（Ｓ４１０）。そして、前述のＳ４１２の処理を実施し、変更確認処理を終了する。

例えば、「それじゃダメ」など、変更案通りではよくない旨の回答が得られていれば（Ｓ４０６：ＮＯ）、別の変更案を提示し（Ｓ４１４）、変更確認処理を終了する。
このような変更確認処理が終了すると、図５に戻り、文字情報に類似する文章を入力として応答候補ＤＢ１０５から検索することによって、応答候補ＤＢ１０５から応答を取得する（Ｓ５６）。ここで、応答候補ＤＢ１０５には、入力となる文字情報と応答となる出力とが一義に対応付けられている。

例えば、スケジュールが入力された場合において、登録が完了した場合には、「登録が完了しました。」などの応答が出力され、予定が重複した旨が記録された場合には、「予定が重複しています」などの応答が出力される。また、変更フラグがＯＮにされた場合には、「この予定では前後の予定を考慮すると移動ができません。・・・のようにしてはいかがですか。」などと、生成した変更案に関する応答が出力される。

また、指令が入力され、指示通りに制御を行う場合には、「了解しました」などの応答が出力され、指示通りに制御できない場合には、「指示が矛盾しています」などの応答が出力される。

また、「今日の※の天気」という文字情報が入力されると、「今日の※の天気は※です」という音声が出力される。ただし、「※」の部分は、地域名とその地域での数日間の天気予報とが対応付けられた天気ＤＢ１１０にアクセスすることで取得される。

続いて、応答内容を音声に変換する（Ｓ６２）。この処理では、音声ＤＢ１０４に格納されたデータベースに基づいて、応答内容（文字情報）を音声として出力する処理を行う。

そして、生成した応答（音声）を通信相手の端末装置１にパケット送信する（Ｓ６４）。なお、応答内容の音声を生成しつつパケット送信してもよい。
続いて、会話内容を記録する（Ｓ６８）。この処理では、入力された文字情報と出力された応答内容を会話内容として学習ＤＢ１０７に記録する。この際、会話内容に含まれるキーワード（音声認識ＤＢ１０２に記録された単語）や発音時の特徴などを学習ＤＢ１０７に記録する。

このような処理が終了すると、音声応答サーバ処理を終了する。
［本実施形態による効果］
以上のように詳述した音声応答システム１００において、サーバ９０（演算部１０１）は、入力された音声の特徴を記録し、入力された音声の特徴が以前に記録された音声の特徴と一致するか否かを判定する。そして、サーバ９０は、音声の特徴が一致しないと判定した場合、音声の特徴が一致すると判定した場合とは異なる応答を出力させる。

このような音声応答システム１００によれば、音声を入力した人物が以前と異なる場合には、音声を入力した人物が以前と同様の場合とは異なる応答を返すことができる。よって、音声を入力した人物が以前と同じか否かに拘わらず同様の回答をする場合と比較して、使用者にとってより使い勝手をよくすることができる。

また、上記音声応答システム１００においてサーバ９０は、入力された音声の特徴に基づいて音声を入力した人物を特定し、入力された音声に従って被制御部９５を制御する。このとき、サーバ９０は、異なる人物から矛盾する指示を受けると予め人物毎に設定された優先順位に従って優先順位の上位の者による指示を優先して制御を実施する。

このような音声応答システム１００によれば、異なる人物から矛盾する指示を受けた場合であったとしても、優先順位に従って被制御部９５に対する制御を実施することができる。

さらに、上記音声応答システム１００においてサーバ９０は、入力された音声に基づくスケジュールを人物毎に記録する。
このような音声応答システム１００によれば、人物毎にスケジュールを管理することができる。

また、上記音声応答システム１００においてサーバ９０は、予定の属性に応じて予定の優先度を変更する。ここで、予定の属性とは、例えば、変更できるか否か（相手への影響があるかどうか）などによって区分される。

そして、予定属性によって先に登録されたスケジュールを変更したり、後から登録されるスケジュールを空いている時間に登録したりする。また、スケジュールを登録する際には、前のスケジュールの場所と後のスケジュールの場所とを考慮し、これらの間を移動するための時間を検索し、これらの間を移動するための移動時間を考慮して後から登録されるスケジュールを登録する。

また、上記音声応答システム１００においてサーバ９０は、当該システム１００が管理する複数の人物が打ち合わせを行う場合のように、同じスケジュールを複数の人物が共有する場合には、これらの複数の人物のスケジュールが空いている時間帯を検索し、この時間に打ち合わせを設定する。また、スケジュールが空いていない場合には、予定属性に応じて既に登録されているスケジュールを変更する。

このような音声応答システムによれば、より使い勝手をよくすることができる。
さらに、上記音声応答システム１００においてサーバ９０は、このようにスケジュールを変更する際には、その旨を音声の応答として出力する。このような音声応答システムによれば、スケジュールを変更する際に、使用者に確認を取ることができる。

また、上記音声応答システム１００においてサーバ９０は、入力された音声が聞き取れない場合（つまり、文字に変換したときに文章として誤りがある場合）に所定の連絡先に発言内容を問い合わせる。また、聞き取れなかった音声を録音し、所定の連絡先に音声を送信し、この連絡先の人物に音声を再度入力する。

このような音声応答システム１００によれば、例えば、子供が話す内容が聞き取れない場合、母親に問い合わせることや、老人が話す内容が聞き取れない場合、老人の家族に問い合わせることによって、入力された音声の正確性に担保することができる。なお、この際、位置情報を利用して問い合わせ元や問い合わせ先を特定するようにしてもよい。

さらに、上記音声応答システム１００においてサーバ９０には、予め使用者（音声を入力した者）の年齢または年齢層を示す年齢情報に応じて準備された複数のデータベースを備えておき、サーバ９０は使用者の年齢情報に従って使用するデータベースを選択し、この選択したデータベースに従って音声を認識する。

このような音声応答システム１００によれば、年齢に応じて音声認識の際に参照するデータベースを変更するので、年齢に応じて使用頻度が高い単語、言葉の言い回しなどを登録しておけば、音声認識の精度を向上させることができる。

また、上記音声応答システム１００においては、使用者（音声を入力した者）の年齢を推定し、推定した年齢を年齢情報として利用する。
使用者の年齢を推定する際には、例えば、入力された音声の特徴（声の波形、声の高さ等）に応じて推定してもよいし、使用者が音声を入力する際にカメラ等の撮像部によって使用者の顔を撮像することによって推定する。

また、使用者の顔を撮像する際には、使用者の識別や年齢認証を行う。
このような音声応答システム１００によれば、より正確に音声の認識を行うことができる。

［その他の実施形態］
本発明の実施の形態は、上記の実施形態に何ら限定されることはなく、本発明の技術的範囲に属する限り種々の形態を採りうる。

例えば、図７に示すスケジュール入力処理において、「９月１日から３日までの間」というように期間（日程および時間帯など）を指定して、スケジュール設定を音声応答システム１００に任せるようにしてもよい。このようにする場合には、例えば、Ｓ１０２の処理とＳ１０４の処理との間において、例えば、「９月１日にＢさん、Ｃさんと１時間の打ち合わせ。」というような、期間を指定したスケジュール設定依頼があったか否かを判定する（Ｓ１０３）。

このようなスケジュール設定依頼がなければ（Ｓ１０３：ＮＯ）、前述のＳ１０４以下の処理を実施する。また、このようなスケジュール設定依頼があれば（Ｓ１０３：ＹＥＳ）、期間指定処理を実施し（Ｓ１３６）、この処理が終了するとスケジュール入力処理を終了する。

期間指定処理では、図１２に示すように、まず、入力された依頼が複数人のスケジュールの調整を必要とするものか否かを判定する。例えば、Ａ氏によって、「９月１日にＢさん、Ｃさんと１時間の打ち合わせ。」と入力された場合には、Ａ氏だけでなく、Ｂ氏およびＣ氏のスケジュールも参照する必要があるため、複数人のスケジュールの調整を必要と判定される。

複数人のスケジュールの調整を必要とすれば（Ｓ３０２：ＹＥＳ）、使用者以外の対象者（音声を入力したＡ氏以外のスケジュールに関与するＢ氏、Ｃ氏）のスケジュールを抽出し（Ｓ３０４）、Ｓ３０６の処理に移行する。

また、複数人のスケジュールの調整を必要としなければ（Ｓ３０２：ＮＯ）、指定された期間内において、対象者全員の予定が空いている時間があるか否かを判定する（Ｓ３０６）。

全員の予定が空いている時間があれば（Ｓ３０６：ＹＥＳ）、この予定をスケジュールＤＢ１１２に登録し（Ｓ３０８）、登録完了した旨を記録し（Ｓ３１０）、スケジュール入力処理を終了する。また、全員の予定が空いている時間がなければ（Ｓ３０６：ＮＯ）、前後の予定についての情報（時間、場所）を抽出する（Ｓ３１２）。

続いて、前後の予定を変更可能か否かを判定する（Ｓ３１４）。前後の予定を変更可能であれば（Ｓ３１４：ＹＥＳ）、変更案を提示する（Ｓ３１６）。
そして、変更フラグをＯＮに設定し（Ｓ３１８）、スケジュール入力処理を終了する。また、前後の予定を変更可能でなければ（Ｓ３１４：ＮＯ）、予定が重複した旨を記録し（Ｓ３２０）、スケジュール入力処理を終了する。

なお、期間指定処理では、Ｓ１１０、Ｓ１１２の処理を省略したが、これらの処理を実施してもよい。
さらに、操作入力処理においては、図１３に示すように、Ｓ２１２およびＳ２１４の処理に換えて、天気予報を取得し（Ｓ２３２）、天気予報に応じて代替案を設定してもよい（Ｓ２３４）。例えば、天気予報を取得した結果、これから気温が上がる傾向にある場合には、エアコンの設定温度を下げる案を提案し、これから気温が下がる傾向にある場合には、エアコンの設定温度を上げる案を提案する。また、これから雨が降りそうであれば、窓を閉める提案を行う。

このようにしても、使い勝手をよくすることができる。
また、上記実施形態においては、文字情報を入力する構成として音声認識を利用したが、音声認識に限らず、キーボードやタッチパネル等の入力手段（操作部７０）を利用して入力されてもよい。また、「入力された音声を文字情報に変換」する作動についてはサーバ９０で行ったが、端末装置１で行ってもよい。

さらに、上記音声応答システム１００において演算部１０１は、使用者の行動（会話、移動した場所、カメラに映ったもの）を学習（記録および解析）しておき、使用者の会話における言葉足らずを補うようにしてもよい。

例えば、「今日はハンバーグでいい？」との質問に対して「カレーがいいな。」と使用者が回答する会話に対して、本装置が「昨日ハンバーグだったからね」と補うと、使用者が、カレーがいいと発言した理由が伝わる。

また、このような構成は、電話中に実施することもでき、また、使用者の会話に勝手に参加するよう構成してもよい。
さらに、上記音声応答システム１００においてサーバ９０は、応答候補を所定のサーバ、またはインターネット上から取得するようにしてもよい。

このような音声応答システム１００によれば、応答候補をサーバ９０だけでなく、インターネットや専用線等で接続された任意の装置から取得することができる。
さらに、現金自動支払機等の対面型の装置に本発明を適用してもよい。この場合、本発明を用いて年齢の認証などの本人確認を行うことができる。

また、本発明を車両に適用してもよい。この場合、人物を特定する構成を車両の鍵に代わる構成として利用することができる。なお、上記発明は音声応答システム１００として説明したが、入力された音声を認識する音声認識装置として構成してもよい。

また、上記実施形態では、端末装置１とサーバ９０とが通信しながら主たる処理をサーバ９０で行う、いわゆるクラウドシステムとして構成したが、一部または全ての処理（フローチャートで示す処理）を端末装置１で実施してもよい。この場合には、端末装置１およびサーバ９０間の通信に関する処理を省略することができる。

また、被制御部９５については、外部からの指令に応じた制御を行う任意の装置が該当する。
さらに、音声応答システム１００において、発せられる音声に機械音であることを示す音である識別音を含むようにしてもよい。機械音と人が話す声とを識別できるようにするためである。この場合、識別音には何れの装置が発した音声であるかを示す識別子を含むようにするとよく、このようにすると複数種類の機械音の発生元を特定することができる。

このような識別音は、可聴音であってもよいし、非可聴音であってもよい。識別音を非可聴音とする場合、電子透かしの技術を利用して識別子を音声に埋め込むようにしてもよい。

また、上記実施形態においては、入力された音声に対応する応答を音声で出力するよう構成したが、音声による入力に限られることなく、この入力に対応する応答を音声で出力してもよい。例えば、使用者の口の形状の変化を検出するカメラを備えておき、使用者の口の形状によって使用者がどのような言葉を話しているかを推定する手段を備えていてもよい。

この場合、口の形状と音との対応関係をデータベースとして準備しておき、口の形状から音を推定し、この音から言葉を推定すればよい。このような構成によれば、使用者は実際に音を発することなく音声を入力することができる。

また、音声を用いて入力を行う際の補助として口の形状を利用してもよい。このようにすれば、使用者の滑舌が悪い場合であってもより確実に音声認識を行うことができる。
さらに、使用者が音声を入力できない場合に備えて、使用者による入力の履歴をディスプレイ上で選択することで音声に代わる入力ができるよう構成してもよい。この場合、単に履歴を新しい順に表示してもよいし、履歴に含まれる入力内容の利用頻度や入力内容が入力された時間帯等を考慮して、利用される可能性が高いと推定される内容から順に表示させるようにしてもよい。

また、車両に端末装置１が搭載されている場合には、車両に対する呼び掛けに対して、持ち主（使用者）からの呼び掛けにだけに応答して解錠する等の特定の作動を行うようにしてもよい。このようにすれば、音声を鍵として利用できるとともに、車両の持ち主が広い駐車場などで自身の車両を見失った場合でも車両に呼び掛けを行うことで自身の車両を見つけることができる。

［本発明の構成と実施形態の構成との関係］
本実施形態における音声応答システム１００は、本発明でいう音声応答装置の一例に相当する。また、サーバ９０が実行する処理のうち、Ｓ７４の処理は本発明でいう人物特定部の一例に相当し、Ｓ７８の処理は本発明でいう音声特徴記録部の一例に相当する。

さらに、Ｓ２１０の処理は本発明でいう音声一致判定部の一例に相当し、Ｓ２１４，Ｓ２１６の処理は本発明でいう音声出力部の一例に相当する。また、Ｓ２０８、Ｓ２１８の処理は本発明でいう制御部の一例に相当し、Ｓ９０の処理は本発明でいうスケジュール記録部の一例に相当する。

Claims

入力された音声に対する応答を音声で行わせる音声応答装置であって、
入力された音声の特徴を記録する音声特徴記録部と、
入力された音声の特徴が以前に前記音声特徴記録部により記録された音声の特徴と一致するか否かを判定する音声一致判定部と、
前記音声一致判定部により音声の特徴が一致しないと判定された場合、音声の特徴が一致すると判定された場合とは異なる応答を出力させる音声出力部と、
を備えたことを特徴とする音声応答装置。
請求項１に記載の音声応答装置において、
入力された音声の特徴に基づいて音声を入力した人物を特定する人物特定部と、
入力された音声に従って被制御部を制御する制御部と、を備え、
前記制御部は、異なる人物から矛盾する指示を受けると予め人物毎に設定された優先順位に従って前記優先順位の上位の者による指示を優先して制御を実施すること
を特徴とする音声応答装置。
請求項１に記載の音声応答装置において、
入力された音声の特徴に基づいて音声を入力した人物を特定する人物特定部と、
入力された音声に基づくスケジュールを前記人物毎に記録するスケジュール記録部と、
を備えたことを特徴とする音声応答装置。