JP2002196789A

JP2002196789A - 音声対話装置

Info

Publication number: JP2002196789A
Application number: JP2000392998A
Authority: JP
Inventors: Naoko Oi; 直子大井; Yoshihiro Kojima; 良宏小島
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 2000-12-25
Filing date: 2000-12-25
Publication date: 2002-07-12

Abstract

(57)【要約】【課題】音声対話装置では、音声対話が単調になると
ユーザーが飽きてしまうことが多く、ユーザーが音声対
話の単調さを感じない音声対話装置の実現が求められて
いる。【解決部】入力音声の認識結果に対する応答文を出力
する対話処理部は、認識に成功した場合は認識文字列を
出力し、認識に失敗した場合は認識リジェクト信号を出
力する認識結果判定部を含む認識結果出力部と、認識失
敗の場合に音声出力される自律応答文を格納している自
律応答辞書を検索し、自律応答文を出力する自律応答文
出力部を備える。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、外部からの音声を
認識しその認識結果に応じて音声による応答（発話）を
行う音声対話装置に関するものである。

【０００２】

【従来の技術】音声対話装置は、その装置のユーザーが
発する音声に対して音声合成回路でつくられた音声によ
って適宜応答する装置であり、ゲーム機や玩具等で利用
されている。このような音声対話装置では、ユーザーと
の対話の際の表現の不自然さを克服する工夫がなされて
きた。例えば特開平７−２３９６９４号公報に示されて
いる音声対話装置では、対話履歴を利用することによっ
て自然な対話を実現しようとしている。また、特開平８
−２９７４９８号公報に示されている音声認識対話装置
では、時間や環境の変化を検出する手段を用いて応答の
音声データに重みづけをして、状況や環境に応じて適切
な応答ができるようにしている。

【０００３】

【発明が解決しようとする課題】従来の音声対話装置で
はユーザーが音声を発し、その音声がマイクロフォンを
経て電気信号の音声入力として得られたとき、それに音
声で応答する（以下、発話という）ものがほとんどであ
る。従ってユーザーが音声入力を行わなければ発話は行
われない。音声対話装置をおもちゃ、ゲーム機、バーチ
ャルペット等に用いる場合、ユーザーが話し掛けなけれ
ば発話が行われないものでは、ユーザーが初めて音声で
対話を行うとき、何を話し掛けてよいのかとまどうこと
がある。また、音声による応答の内容が容易に予想可能
であったり、ユーザーの音声入力に対して定形的な内容
の応答しか得られなかったりすると、対話の内容が単調
になる。その結果、ユーザーが意外性を感じることは少
なくなり、やがて飽きてしまうことが多い。音声対話装
置では、ユーザーが音声対話装置との対話に単調さを感
じないものを実現することが求められている。本発明
は、音声対話装置に自発的に発話する機能を持たせるこ
とによって、音声対話が単調にならないような音声対話
装置を提供することを目的としている。

【０００４】

【課題を解決するための手段】本発明の音声対話装置
は、音声を検出しそれに対応する音声信号を出力する音
声入力部、前記音声入力部から入力された音声信号から
音声の文字列を認識する音声認識部、前記音声認識部で
認識された文字列による入力文データに対する応答文デ
ータを出力する対話処理部、前記応答文データを音声と
して出力する音声出力部を有する。前記対話処理部は、
認識した文字列に基づいて認識に成功したか認識に失敗
したかを判定し、認識に成功した場合には認識文字列を
示すデータを出力し、認識に失敗した場合には自律応答
文出力部に認識リジェクト信号を出力する認識結果判定
部を含む認識結果出力部、前記認識結果出力部において
認識が成功したと判定された場合に音声で出力される応
答文のデータを格納している応答辞書、前記認識結果出
力部において認識が失敗したと判定された場合に音声で
出力される自律応答文データを格納している自律応答辞
書、前記認識文字列による入力文データが入力された場
合に、前記応答辞書を検索し前記入力文データに対応す
る応答文データを出力する応答文出力部、前記認識リジ
ェクト信号が入力された場合には、前記自律応答辞書を
検索し自律応答文データを出力する自律応答文出力部、
及び前記応答文及び自律応答を音声として出力する音声
出力部を有する。

【０００５】本発明の音声対話装置によれば、音声をマ
イクロフォンで検出して得た音声信号を音声認識部に入
力し、音声の文字列を認識する。文字列の認識結果か
ら、認識結果判定部は、認識に成功したか失敗したかの
判定を行い、認識に成功した場合は、認識した文字列に
よる入力文データを応答文出力部に出力する。応答文出
力部は入力文データに対応する応答文のデータを出力す
る。認識に失敗した場合は、認識結果判定部は認識リジ
ェクト信号を自律応答文出力部に出力する。自律応答文
出力部は、認識リジェクト信号が入力されると、自律応
答辞書を検索して自律応答文のデータを音声出力部に出
力する。これによって、認識に失敗した場合にも音声対
話装置から自律的に応答文を発話することができ、ユー
ザーが対話に飽きないようにすることができる。

【０００６】

【発明の実施の形態】以下、本発明の好適な実施例を、
図１から図８を用いて説明する。《第１実施例》図１は本発明の音声対話装置の構成を示
すブロック図である。図１において、マイクロフォン１
００はユーザーが発する音声を検出し、音声信号を音声
入力部１０１に入力する。音声入力部１０１で所望のレ
ベルに増幅された音声信号１０１Ａは音声認識部１０２
に入力される。音声認識部１０２において、音声信号１
０１Ａから音声の文字列を検出して音声を認識する。音
声認識部１０２の詳細な構成を図２に示す。図２は、音
声認識装置として従来からよく知られている構成であ
り、音声信号１０１Ａが入力される音響分析部８０１，
距離計算部８０２，及び認識辞書８０３を有する。

【０００７】音響分析部８０１は、音声信号１０１Ａの
特徴パラメータ８０１Ａを抽出し距離計算部８０２に印
加する。距離計算部８０２において、特徴パラメータ８
０１Ａと、単語標準音声パターンとして認識辞書８０３
に登録されている各単語の特徴パラメータとをマッチン
グアルゴリズムを用いて比較する。マッチングアルゴリ
ズムでは、例えば特徴パラメータ８０１Ａの各次元のベ
クトルと単語標準音声パターンの各次元のベクトルとの
距離をそれぞれ算出しその総和を求める。この総和を入
力音声信号１０１Ａのパターンと単語標準音声パターン
との距離Ｘとする。次に距離Ｘが最小の場合を最高点
（例えば１００）となるように正規化して、これを認識
文字列の信頼度Ｙとする。そして信頼度Ｙが最も高い単
語標準音声パターンに対応する認識文字列と、信頼度Ｙ
を「認識結果」の入力文データ１０２Ａとして出力す
る。マッチングアルゴリズムの詳細については、森健一
監修「パターン認識」電子情報通信学会（ｐｐ．１１１
−１１３）に記載されている。

【０００８】音声認識部１０２によって得られた認識結
果の入力文データ１０２Ａは対話処理部１０３に入力さ
れる。対話処理部１０３は、認識結果に対する応答文デ
ータ１０３Ａを生成する。応答文データ１０３Ａは音声
出力部１０４で音声信号に変換されスピーカ１２０から
音声で応答文として発せられる。対話処理部１０３に
は、認識結果判定部１１０を備えた認識結果出力部１０
５、応答文を出力するための応答辞書１０７と応答文出
力部１０６、及び自律応答文を出力するための自律応答
辞書１０９と自律応答文出力部１０８が含まれる。自律
応答文とは、ユーザーが所定の時間内に音声を発しない
とき、又はユーザーの音声が認識されなかったときに、
音声対話装置が発するあらかじめ定められた定形文であ
る。認識結果判定部１１０は、認識文字列とその信頼度
Ｙのデータからなる入力文データ１０２Ａに基づいて認
識に成功したか失敗したかの判定を行う。認識結果判定
部１１０は、信頼度Ｙが予め設定された値（例えば７
０）以上なら認識が成功したと判定し、そうでなければ
認識が失敗したと判定する。認識に成功したと判定した
場合は、認識文字列データ１１０Ａを応答文出力部１０
６に出力する。応答文出力部１０６は応答辞書１０７を
検索して認識文字列に対応する応答文を求めそのデータ
を音声出力部１０４に出力する。応答辞書１０７には、
認識が成功したと判定された場合に出力される多数の応
答文例のデータが格納されている。認識に失敗したと判
定された場合は、認識結果判定部１１０から認識リジェ
クト信号１１０Ｂが自律応答文出力部１０８に出力され
る。自律応答文出力部１０８は自律応答辞書１０９を検
索して適当な自律応答文を求めそのデータを音声出力部
１０４に出力する。自律応答辞書１０９には、認識が失
敗したと判定された場合に出力される多数の自律応答文
例のデータが格納されている。

【０００９】認識結果出力部１０５にはタイマー１１１
とカウンタ１１２が含まれている。なお、カウンタ１１
２は第１の実施例では使用しておらず、第３の実施例で
使用する。タイマー１１１は、認識結果に対応して応答
文が音声出力部１０４から出された後、次の音声が入力
されその認識結果の入力文データ１０２Ａが認識結果判
定部１１０に入力されるまでの時間（以下、この時間を
認識待ち時間と呼ぶことにする）を計測する。また応答
文が出された後次の音声が入力されるまでの時間に閾値
を予め設定しておく（以下、この時間を音声入力待ち受
け時間と呼ぶことにする）。音声入力待ち受け時間内
（認識待ち時間＜音声入力待ち受け時間）に認識が成功
しない場合は、認識結果判定部１１０は認識リジェクト
信号１１０Ｂを出力する。

【００１０】図３は第１の実施例の音声対話処理の動作
の流れを示したフローチャートである。タイマー１１１
が時間計測を開始すると（ステップ２０１）、認識結果
判定部１１０は、音声待ち受け時間内に認識が成功する
か失敗するかを判定する（ステップ２０２）。認識が成
功した場合は認識文字列データ１１０Ａを応答文出力部
１０６に出力する（ステップ２０３）。応答文出力部１
０６は応答辞書１０７から認識文字列による入力文デー
タ１０２Ａに対応する応答文データを検索し、音声出力
部１０４に出力する（ステップ２０４）。音声を出力し
た後（ステップ２０７）、タイマー１１１を初期化し
（ステップ２０８）、再び認識待ち時間の計測を開始す
る（ステップ２０１）。

【００１１】ステップ２０２において、認識に失敗した
場合は、認識結果判定部１１０は、認識リジェクト信号
１１０Ｂを自律応答文出力部１０８に出力する（ステッ
プ２０５）。認識リジェクト信号１１０Ｂを受け取った
自律応答文出力部１０８は自律応答辞書１０９から自律
応答文を検索し、応答文データ１０３Ａとして音声出力
部１０４に出力する（ステップ２０６）。自律応答文を
音声で出力した後（ステップ２０７）、タイマー１１１
を初期化し（ステップ２０８）、再び認識待ち時間の計
測を開始する（ステップ２０１）。これにより、音声入
力待ち受け時間内に音声入力がない場合には音声対話装
置から自律的に発話させることができ、ユーザーを対話
に飽きさせないようにすることができる。

【００１２】《第２の実施例》第２の実施例の音声対話
装置は図１に示す第１の実施例と同様の構成を有する。
第２の実施例では、音声対話の動作が第１実施例と異な
っている。図１の認識結果出力部１０５に含まれるタイ
マー１１１が、認識待ち時間の計測とタイマー１１１が
初期化されてから認識が成功するまでの経過時間（以
下、認識成功待ち時間と呼ぶことにする）の計測をす
る。図４は第２の実施例の音声対話処理を示すフローチ
ャートである。ステップ３０１でタイマー１１１が時間
計測を開始すると、認識結果判定部１１０は、音声待ち
受け時間内に認識が成功するか失敗するかを判定する
（ステップ３０２）。認識が成功したと判定された場合
は認識文字列データ１１０Ａを応答文出力部１０６に出
力する（ステップ３０３）。応答文出力部１０６は応答
辞書１０７から認識文字列に対応する応答文を検索し
（ステップ３０４）、応答文データ１０３Ａを音声出力
部１０４に出力する（ステップ３０５）。タイマー１１
１の認識成功待ち時間と認識待ち時間を初期化し（ステ
ップ３０６、ステップ３１０）、再び認識成功待ち時間
と認識待ち時間の計測を開始する（ステップ３０１）。

【００１３】ステップ３０２において、認識に失敗した
と判定された場合は、認識結果判定部１１０は、認識リ
ジェクト信号１１０Ｂを自律応答文出力部１０８に出力
する（ステップ３０７）。認識リジェクト信号１１０Ｂ
を受け取った自律応答文出力部１０８は自律応答辞書１
０９から自律応答文を検索し、応答文データ１０３Ａと
して音声出力部１０４に出力する（ステップ３０８）。
音声出力後（ステップ３０９）、タイマー１１１の音声
入力待ち受け時間を初期化し（ステップ３１０）、再び
認識待ち時間の計測を開始する（ステップ３０１）。ス
テップ３０７において、認識リジェクト信号１１０Ｂの
出力時に、タイマー１１１から認識成功待ち時間のデー
タを自律応答文出力部１０８に出力する。このとき自律
応答文出力部１０８がタイマー１１１に記録されている
認識成功待ち時間を読み取ってもよい。

【００１４】自律応答辞書１０９には認識成功待ち時間
のデータに対応した自律応答文のデータが格納されてい
る。図５の（ａ）は自律応答辞書１０９のデータ構造の
一例を示す表である。自律応答辞書１０９には認識成功
待ち時間データ４０１と自律応答文データ４０２が対に
なって格納されている。認識成功待ち時間は、タイマー
１１１が初期化されてからの経過時間を表し、認識が成
功するとタイマー１１１は再び初期化される。具体的な
自律応答辞書のデータの例を図５の（ｂ）に示す。図５
の（ｂ）に示すように、認識リジェクト信号が出力され
たとき、タイマー１１１に記録されている認識成功待ち
時間が「時間００」の場合は、「何か話して」という自
律応答文が出力される。「時間０１」、「時間０２」で
は何も出力されない。「時間０３」のときは「誰かいな
いの？」という自律応答文が出力される。

【００１５】なお、自律応答辞書１０９には必ずしも認
識待ち時間データ４０１が格納されていなくてもよい。
例えば、自律応答辞書１０９に認識成功待ち時間データ
の値が小さい順にそれらに対応する自律応答文データを
行ごとに格納しておき、認識成功待ち時間に対応する行
に格納されている自律応答文を出力してもよい。第２の
実施例では、タイマー１１１は音声待ち受け時間を計測
すると同時に、認識成功待ち時間を計測する。すなわ
ち、音声待ち受け時間ごとにステップ３０２の判定を行
う。ステップ３０６のタイマー１１１の初期化は、認識
成功待ち時間の初期化を行い、ステップ３１０のタイマ
ーの初期化は、音声入力待ち受け時間の初期化を行う。
この場合はステップ３０６はなくてもよい。このように
して、認識待ち時間に対応する自律応答文を出力するこ
とによって音声対話装置が自律的に発話する条件を設定
することができる。これにより発話タイミングや発話内
容に変化をつけることができるので、ユーザーを対話に
飽きさせないようにすることができる。

【００１６】《第３の実施例》第３の実施例の音声対話
装置は図１に示すものと同じである。第３の実施例では
認識結果出力部１０５に含まれるタイマー１１１の動作
は第１の実施例と同様であるが、カウンタ１１２が、音
声入力待ち受け時間内に認識が失敗したと判定された回
数を数えて記録する。図６は第３の実施例の音声対話処
理を示すフローチャートである。ステップ５０１でタイ
マー１１１が時間計測を開始すると、認識結果判定部１
１０は、音声待ち受け時間内に認識が成功するか失敗す
るかを判定する（ステップ５０２）。認識が成功したと
判定された場合は認識文字列データ１１０Ａを応答文出
力部１０６に出力する（ステップ５０３）。応答文出力
部１０６は、応答辞書１０７から認識文字列データ１１
０Ａに対応する応答文のデータを検索し（ステップ５０
４）、音声出力部１０４に応答文データ１０３Ａとして
出力する（ステップ５０５）。ステップ５０５で音声を
出力した後、ステップ５１１でカウンタ１１２の記録回
数を初期化し、ステップ５１２でタイマー１１１を初期
化して、再び認識待ち時間の計測を開始する（ステップ
５０１）。

【００１７】ステップ５０２において、認識に失敗した
場合は、カウンタ１１２に記録されている回数（以下、
カウンタ記録回数と呼ぶことにする）が１つ増える。ス
テップ５０７で、カウンタ記録回数が予め設定されてい
る一定の回数を超えたかどうかを判定する。超えている
場合は、認識結果判定部１１０は、認識リジェクト信号
１１０Ｂを自律応答文出力部１０８に出力する（ステッ
プ５０８）。認識リジェクト信号を受け取った自律応答
文出力部１０８は自律応答辞書１０９から自律応答文の
データを検索し（ステップ５０９）、音声出力部１０４
に出力する（ステップ５１０）。ステップ５１０で音声
を出力した後、ステップ５１１でカウンタ記録回数を初
期化し、ステップ５１２でタイマー１１１を初期化し、
再び認識待ち時間の計測を開始する（ステップ５０
１）。ステップ５０７において、カウンタ記録回数が予
め設定されている回数を超えない場合は、ステップ５１
２でタイマー１１１を初期化し、再び認識待ち時間の計
測を開始する（ステップ５０１）。なお、ステップ５０
５の後、ステップ５１１を行わずにステップ５１２を行
ってもよい。このようにして、カウンタ１１２に記録さ
れた回数に対応する自律応答文を出力することによって
音声対話装置が自律的に発話する条件を設定することが
できる。これにより発話タイミングや発話内容に変化を
つけることができるので、ユーザーを対話に飽きさせな
いようにすることができる。

【００１８】《第４の実施例》第４の実施例の音声対話
装置は図１に示すものと同じである。第４の実施例にお
いては、自律応答辞書１０９が、カウンタ１１２のカウ
ンタ記録回数データに対応する自律応答文のデータを格
納している。認識結果測定部１１０が認識リジェクト信
号１１０Ｂを出力すると、カウンタ１１２はカウンタ記
録回数データを自律応答文出力部１０８に出力する。こ
の場合自律応答文出力部１０８がカウンタ１１２にカウ
ンタ記録回数を読み取りに行ってもよい。図７の（ａ）
は自律応答辞書のデータ構造の一例を示す表である。自
律応答辞書にはカウンタ記録の回数データ６０１と自律
応答文のデータ６０２とが対になって格納されている。
図７の（ｂ）に具体的な自律応答辞書１０９の内容の例
を示す。図７の（ｂ）に示すように、認識リジェクト信
号１１０Ｂが出力されたときカウンタ１１２に記録され
ているカウンタ記録回数が「回数００」の場合は、「何
か話して」という自律応答文を出力し、「回数０１」
「回数０２」では何も出力しない。「回数０３」のとき
は「誰かいないの？」という自律応答文を出力する。

【００１９】なお、自律応答辞書１０９にはカウンタ記
録回数データ６０１は格納されていなくてもよい。例え
ば、自律応答辞書１０９にカウンタ記録回数データの小
さい順にそれらに対応する自律応答文データが行ごとに
格納されており、カウンタ記録回数データに対応する行
に格納されている自律応答文データを出力してもよい。
このようにして、カウンタ１１２に記録された回数に対
応する自律応答文を出力することによって音声対話装置
が自律的に発話する条件を設定することができる。これ
により、発話タイミングや発話内容に変化をつけること
ができるので、ユーザーを対話に飽きさせないようにす
ることができる。

【００２０】《第５の実施例》第５の実施例の音声対話
装置は図１に示すものと同じである。第５の実施例では
自律応答辞書１０９が日時に対応した自律応答文を格納
している。例えば、認識結果判定部１１０から認識リジ
ェクト信号１１０Ｂが出力されたときの日時のデータに
対応する自律応答文のデータを自律応答辞書１０９から
検索する。図８の（ａ）は自律応答辞書１０９のデータ
構造の一例を示す表である。自律応答辞書１０９には時
刻あるいは日付のデータ７０１と自律応答文のデータ７
０２が格納されている。図８の（ｂ）に具体的な自律応
答辞書１０９の内容の一例を示す。図８の（ｂ）におい
て、左欄には、時間または期日の範囲のデータが格納さ
れ、右欄には、各時間または期日の範囲に対応する自律
応答文のデータが格納されている。

【００２１】例えば、図８の（ｂ）において、認識リジ
ェクト信号１１０Ｂの発生時刻が７：００ならば、「お
はようございます」という自律応答文を出力し、２０：
３０ならば、「こんばんは」という自律応答文を出力す
る。また日付が１月１日ならば、「あけましておめでと
う」という自律応答文を出力する。一年のすべての日付
に対応する自律応答文がない場合でも、例えば、国民の
祝日や、１２月２５日（クリスマス）のような特別な日
には、その日に対応する自律応答文を格納しておき、そ
の日に対応する自律応答文を出力する。対応する自律応
答文がない日には時刻に対応した自律応答文を出力して
もよい。「あけましておめでとう」などの自律応答文は
同じ日には１度しか出力せず、あとは時刻に対応した自
律応答文を出力するようにしてもよい。また日付や時刻
に優先順位や出力条件をつけておいてもよい。これによ
り、ユーザーは音声対話装置との対話によって時間的・
季節的な変化を感じることができる。なお、前記の各実
施例において自律応答辞書を複数備えていてもよい。

【００２２】

【発明の効果】以上の各実施例で詳細に説明したよう
に、本発明によれば、音声入力がない場合にも音声対話
装置から自律的に発話させることにより、ユーザーを対
話に飽きさせないようにすることができる。さらに、タ
イマーで計測した認識成功待ち時間データに対応する自
律応答文データを自律応答辞書に格納し、自律応答文出
力部が、自律応答辞書を検索して認識待ち時間データに
対応する自律応答文データを出力することができる。ま
た自律応答辞書にカウンタに記録された回数データに対
応する自律応答文データを格納し、自律応答文出力部で
自律応答辞書を検索し、カウンタに記録された回数に対
応する自律応答文を出力することによって、音声対話装
置が自律的に発話する条件を設定することができる。こ
れにより発話タイミングや発話内容に変化をつけること
ができるのでユーザーを対話に飽きさせないようにする
ことができる。さらに、認識リジェクト信号入力時の日
時データに対応する前記自律応答文データを自律応答辞
書に格納しておく。自律応答文出力部は自律応答辞書を
検索し、認識リジェクト信号入力時の日時に対応する自
律応答文を出力することによって時間や季節に応じた自
律応答を出力することができ、ユーザーは対話に時間的
・季節的な変化を感じることができる。

【図面の簡単な説明】

【図１】本発明の各実施例に共通の音声対話装置のブロ
ック図

【図２】音声認識部１０２のブロック図

【図３】本発明の第１の実施例における音声対話処理を
示すフローチャート

【図４】本発明の第２の実施例における音声対話処理を
示すフローチャート

【図５】本発明の第２の実施例における自律応答辞書の
構造を示す表

【図６】本発明の第３の実施例における音声対話処理を
示すフローチャート

【図７】本発明の第４の実施例における自律応答辞書の
構造を示す表

【図８】本発明の第５の実施例における自律応答辞書の
構造を示す表

【符号の説明】

１００マイクロフォン１０１音声入力部１０２音声認識部１０３対話処理部１０４音声出力部１０５認識結果出力部１０６応答文出力部１０７応答辞書１０８自律応答文出力部１０９自律応答辞書１１０認識結果判定部１１１タイマー１１２カウンタ４０１認識成功待ち時間４０２自律応答文６０１カウンタ記録回数６０２自律応答文７０１時刻・日付７０２自律応答文

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｇ１０Ｌ 3/00 ５６１Ａ

Claims

【特許請求の範囲】

【請求項１】音声を検出しそれに対応する音声信号を
出力する音声入力部、前記音声入力部から入力された音声信号から音声の文字
列を認識する音声認識部、前記音声認識部で認識された文字列による入力文データ
に対する応答文データを出力する対話処理部、前記応答文データを音声として出力する音声出力部を有
し、前記対話処理部は、認識した文字列に基づいて、認識に成功したか認識に失
敗したかを判定し、認識に成功した場合には認識文字列
データを出力し、認識に失敗した場合には、自律応答文
出力部に認識リジェクト信号を出力する認識結果判定部
を含む認識結果出力部、前記認識結果出力部において認識が成功したと判定され
た場合に、音声で出力される応答文のデータを格納して
いる応答辞書、前記認識結果出力部において認識が失敗したと判定され
た場合に、音声で出力される自律応答文のデータを格納
している自律応答辞書、前記認識文字列による入力文データが入力された場合
に、前記応答辞書を検索し、前記入力文データに対応す
る応答文データを出力する応答文出力部、及び前記認識
リジェクト信号が入力された場合には、前記自律応答辞
書を検索し、自律応答文データを出力する自律応答文出
力部、を有する音声対話装置。
【請求項２】前記入力文データは認識文字列のデータ
とその信頼度を示す信頼度データからなり、前記認識結果判定部は、前記認識文字列の信頼度データ
値が予め設定された所定値以上であれば認識が成功した
と判定し、所定値より小さいとき認識が失敗したと判定
することを特徴とする請求項１記載の音声対話装置。
【請求項３】認識結果出力部は、前記音声出力部によ
って音声が出力された後、前記認識結果判定部に次の認
識結果を示す入力文データが入力されるまでの認識待ち
時間を計測するタイマーを有し、前記認識結果判定部は、前記認識待ち時間が予め設定さ
れた音声入力待ち受け時間を超えるまでに認識が成功し
たと判定されない場合に、前記認識リジェクト信号を出
力することを特徴とする請求項２記載の音声対話装置。
【請求項４】認識結果出力部は、前記認識待ち時間
が、予め設定された音声入力待ち受け時間を超えるまで
に、前記認識結果判定部において認識に失敗したと判定
された回数を数えるカウンタを有し、前記認識結果判定部は、前記カウンタに記録された回数
が予め設定された回数を超えた場合に、前記認識リジェ
クト信号を出力することを特徴とする請求項３記載の音
声対話装置。
【請求項５】前記認識結果判定部は、認識に成功した
と判定された場合には、前記カウンタをリセットするこ
とを特徴とする請求項４記載の音声対話装置。
【請求項６】自律応答辞書は、前記タイマーにおいて
計測した前記認識待ち時間に対応する自律応答文のデー
タを格納しており、前記自律応答文出力部は、前記自律応答辞書を検索し、
前記認識待ち時間に対応する自律応答文のデータを出力
することを特徴とする請求項３から請求項５のいずれか
に記載の音声対話装置。
【請求項７】自律応答辞書は、前記カウンタに記録さ
れた回数に対応する前記自律応答文のデータを格納して
おり、前記自律応答文出力部は、前記自律応答辞書を検索し、
前記カウンタに記録された回数に対応する自律応答文の
データを出力することを特徴とする請求項４から請求項
６のいずれかに記載の音声対話装置。
【請求項８】自律応答辞書は、前記認識リジェクト信
号入力時の日時に対応する前記自律応答文のデータを格
納しており、前記自律応答文出力部は、前記自律応答辞書を検索し、
前記認識リジェクト信号入力時の日時に対応する自律応
答文のデータを出力することを特徴とする請求項１から
請求項７のいずれかに記載の音声対話装置。