JPH11237971A

JPH11237971A - 音声応答装置

Info

Publication number: JPH11237971A
Application number: JP10040873A
Authority: JP
Inventors: Tasuku Shinozaki; 翼篠崎; Masanobu Abe; 匡伸阿部
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 1998-02-23
Filing date: 1998-02-23
Publication date: 1999-08-31

Abstract

(57)【要約】【課題】応答音声を確実に伝達し、人間同士の会話と
同様にスムース゛で自然なインタラクションを行ってユーサ゛フレント゛リネスを
提供し、ヒューマンインターフェース効率を向上させる。【解決手段】入力ＩＮはユーサ゛の動作やユーサ゛による操作
の検出結果である。解釈装置３は入力ＩＮに応じたシステム
動作を記述した文脈スクリフ゜ト２を解釈する。リアクションセット４
はインタラフ゜ト音声や指示音声の音声テ゛ータである。出力履歴
保存装置１２はユーサ゛への応答音声の出力履歴を保存す
る。リアクションモート゛決定装置６は擬人的性格を記述した性格
モート゛５と出力履歴から応答音声に変化を与えるためのリア
クションモート゛を決定する。インタラフ゜ト音声生成装置７はユーサ゛の
動作に割り込むインタラフ゜ト音声を生成する。指示音声生成
装置８はユーサ゛への指示音声を生成する。出力装置１はリア
クション音声ＲＶを出力するにあたり、インタラフ゜ト音声を出力
してから指示音声を出力するなどの制御を行う。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、合成音声による応
答を行う音声応答装置に関するものである。

【０００２】

【従来の技術】音声による応答は、電話による応答装
置，金融機関のＣＤ（現金自動支払機）やＡＴＭ（現金
自動預入支払機），各種の自動販売機，電卓，しゃべる
おもちゃ，コンピュータ，音声対話システム，自動受付
システム，ＣＡＩ（コンピュータ援用教育）システムと
いったものに利用されている。これらの機器に用いる音
声としては、予め録音した自然音声、予め録音した音声
をつなぎあわせた音声（「録音編集合成音声」）、日本
語文章を所定の規則に従って変換した音声（「規則合成
音声」）、音韻記号とＦ₀（基本周波数），継続時間．
パワーといった韻律パラメータを操作して合成した音声
（「パラメータ合成音声」）、波形編集合成音声などが
考えられる。

【０００３】

【発明が解決しようとする課題】上述したそれぞれのシ
ステムでは、システムを利用する人間（以下、「ユー
ザ」）に対し、これらの音声を用いて応答を行ってい
る。そのため、ユーザがシステムに対して集中して何ら
かの操作を行っている途中であるとか、ユーザの注意が
他のことに向けられているためにシステムから注意がそ
れていると、システムからの応答に気づかなかったり応
答内容を聞き逃したりするといった問題が起こる。

【０００４】こうした問題を回避するため、応答内容を
伝える音声を発する前にブザーやベルによって注意を喚
起することが考えられるが、ユーザを必要以上に驚かせ
たりイライラさせたりすることがある。そのためこうし
た状況では、ユーザとシステムの間でスムーズで自然な
やりとり（以下、「インタラクション」）を行わせるこ
とは困難であって、ヒューマンインタフェースの見地か
らユーザフレンドリなインタフェースとは言い難い。

【０００５】また、従来は、システムの応答音声がそれ
ぞれのシステムを利用するユーザの入力に対応して一意
に決められてしまっている。そのため、ユーザが何度か
システムを利用していると、「○○をすると××といっ
た応答音声を出力する」といったことが予想できてしま
い、システムに対して一本調子，機械的，単調といった
印象を抱いてしまうという問題もある。このような問題
点を解決するために、システムからの応答音声をランダ
ムな順序で出力することも考えられなくはない。しかし
ながら、単にランダムな順序で出力するのでは、システ
ムに一貫した特徴を持たせることが困難であったり、シ
ステムとして達成すべき目的を実現することが困難であ
ったりする。

【０００６】本発明は上述した点に鑑みてなされたもの
であって、その目的は、以下に述べる課題を解決するこ
とのできる音声応答装置を提供することにある。ユーザの動作／操作の何れか又は双方に対して音声
による応答を行う際、応答音声をユーザに伝える前に、
ユーザの注意を引くための注意音声を出力するように
し、それによって、応答音声を確実にユーザに伝える。ユーザの注意を引くために、ブザーやベルではなく
間投詞や指示語といった音声を用いるようにする。システムの動作が記述されている文脈スクリプトに
従って一貫性のある特徴を持った多様なリアクション音
声を返し、ユーザがシステムに対して持つ一本調子，機
械的，単調といった印象を解消する。そうすることで、
我々人間同士で会話を行うときと同様に、ユーザとシス
テムの間でスムーズで自然なインタラクションを行わせ
るとともに、システムをユーザフレンドリ化すること
で、ユーザがシステムを使う気になる，システムを使っ
て楽しい，システムを使って面白い，システムに親しみ
を持つ，システムを使いやすい等と感じられるようにし
て、ヒューマンインタフェースの効率を向上せしめる。

【０００７】

【課題を解決するための手段】以上の課題を解決するた
めに、請求項１記載の発明は、ユーザの動作や該ユーザ
による操作を検出する検出手段と、前記検出手段の検出
結果に応じたシステム動作が記述された文脈スクリプト
を解釈して解釈結果を出力する解釈手段と、前記ユーザ
に応答を行った応答音声の出力履歴を保存してゆく履歴
保存手段と、擬人的性格が記述された性格モードと前記
出力履歴に基づいて、前記応答音声に変化を与えるため
のリアクションモードを決定するリアクションモード決
定手段と、前記検出結果，前記解釈結果および前記リア
クションモードに基づいて、前記ユーザの動作に割り込
むインタラプト音声を生成するインタラプト音声生成手
段と、前記検出結果，前記解釈結果および前記リアクシ
ョンモードに基づいて、前記ユーザに対する指示音声を
生成する指示音声生成手段とを具備することを特徴とし
ている。

【０００８】また、請求項２記載の発明は、請求項１記
載の発明において、前記指示音声生成手段は、前記検出
結果と前記解釈結果に基づいて前記ユーザに指示すべき
指示項目を決定する指示項目決定手段と、前記指示項目
と前記リアクションモードに基づいて指示メッセージを
生成する指示メッセージ生成手段と、前記リアクション
モードに基づいて前記指示メッセージを修飾する指示メ
ッセージ修飾手段とから成ることを特徴としている。ま
た、請求項３記載の発明は、請求項１又は２記載の発明
において、音声データを集めたリアクションセットが予
め記憶されているリアクションセット記憶手段をさらに
具備し、前記インタラプト音声生成手段は、生成すべき
インタラプト音声に対応する音声データを前記リアクシ
ョンセットの中から選択することで、前記インタラプト
音声の生成を行うことを特徴としている。

【０００９】また、請求項４記載の発明は、請求項３記
載の発明において、前記リアクションセットは、汎用的
な応答音声データを集めた汎用リアクションセットと、
前記文脈スクリプトに依存する音声データを集めた特定
リアクションセットからなることを特徴としている。ま
た、請求項５記載の発明は、請求項３又は４記載の発明
において、前記リアクションセットを構成する音声デー
タは、韻律を整合した合成音声の韻律パラメータで表さ
れることを特徴としている。また、請求項６記載の発明
は、請求項１〜５の何れかの項記載の発明において、前
記インタラプト音声生成手段から前記インタラプト音声
を出力させたのちに、前記指示音声生成手段から前記指
示音声を出力させる出力制御手段をさらに具備すること
を特徴としている。

【００１０】また、請求項７記載の発明は、請求項１〜
６の何れかの項記載の発明において、前記インタラプト
音声生成手段又は前記指示音声生成手段の少なくとも一
方は、前記インタラプト音声又は前記指示音声を合成音
声により生成することを特徴としている。また、請求項
８記載の発明は、請求項７記載の発明において、前記合
成音声は、録音編集合成音声，波形編集合成音声，規則
合成音声，パラメータ合成音声の何れかであることを特
徴としている。また、請求項９記載の発明は、請求項１
〜８の何れかの項記載の発明において、ＣＡＩシステム
に組み込まれ、或いは、該ＣＡＩシステムとともに用い
られることを特徴としている。

【００１１】

【発明の実施の形態】以下、図面を参照して本発明の一
実施形態について説明する。本実施形態では、音声によ
りインタラクティブな指示を行う「ＣＡＩペン習字シス
テム」へ音声応答装置を適用した場合を例に挙げる。こ
のシステムは、ユーザが液晶画面付きペンタブレットを
用いて、画面に表示されたお手本をペンでなぞってペン
習字の練習を行うものである。そして、ユーザが液晶画
面上に表示されたお手本をなぞると、書きはじめの位置
やストローク（一筆）のずれについて、音声による指示
をインタラクティブに行うほか、正しくなぞなれている
場合には褒めるといったことも行う。

【００１２】このように、本実施形態のシステムは、ユ
ーザのペン入力に対してリアクション音声を返してイン
タラクティブに教示を行うものである。その際、同時に
リアクション音声を通して「やさしい先生」であるとか
「厳しい先生」といったような個性をシステムに与える
ことも考えている。こうしてインタラクティブな教示と
個性を与えることで、ユーザがシステムに対して人間っ
ぽさや親しみを感じて楽しくペン習字を行えるユーザフ
レンドリなシステムを目指している。

【００１３】さて、図１は本実施形態による音声応答装
置の構成を示すブロック図である。同図において、入力
ＩＮは、キーボード，マウスやタッチパネルやペンタブ
レットといったポインティング装置，ジョイスティッ
ク，ジョイパッド，その他の機器からの入力のほか、マ
イクロホンセンサ，磁気センサ，光センサ，圧力セン
サ，静電容量センサ，超音波センサ，画像認識装置，音
声認識装置，動画像認識装置，ＰＢ（プッシュボタン）
信号認識装置，その他の物理量を検出するセンサなどか
らの入力である。つまり、これら入力機器やセンサによ
って、ユーザの動作やユーザによる操作を認識するのに
必要とされるデータが入力ＩＮとして得られる。

【００１４】出力装置１は音声／画像の何れか又は双方
を出力するもので、この出力装置１を使用することによ
って、システムの状態やユーザに対する指示，質問，応
答について、音声出力／画像表示の何れか又は双方を行
う。文脈スクリプト２は図示省略した記憶装置に格納さ
れており、入力ＩＮに基づくユーザへの指示，質問，応
答を行うためのシステムの動作が記述されている。解釈
装置３はこの文脈スクリプト２を解釈してその解釈結果
を出力するものである。

【００１５】リアクションセット４は、図示省略した記
憶装置にインタラプト音声や指示音声の音声データを格
納したものであり、図１ではｎ（自然数）個のリアクシ
ョンセット４-1〜４-nが格納されている様子を示してあ
る。これらの音声は、波形データ，韻律（Ｆ₀，パワ
ー，継続時間長）データ及び音韻記号列，日本語テキス
トデータ，制御タグ付きテキストや制御記述言語といっ
た形で格納されている。リアクションセット４の音声デ
ータとして、韻律を適切に整合した合成音声の韻律パラ
メータの形で用意することで、自然で多様な韻律を持ち
なお且つコンパクトなものも利用できるようになる。

【００１６】また、リアクションセット４は「汎用リア
クションセット」および「特定リアクションセット」の
２種類のリアクションセットに大別される。「汎用リア
クションセット」は、「怒った感じ」，「哀しい感
じ」，「喜んだ感じ」，「楽しい感じ」，「のりのよい
感じ」，「すました感じ」といった感情を表現できる相
槌や合いの手、「えっ」や「あー」等の間投詞といった
システムの応答として汎用的に利用できる音声データを
集めたものである。これに対し、「特定リアクションセ
ット」は「右から」，「長く」などといった文脈スクリ
プト２やタスクに依存する音声データを集めたものであ
る。このようにリアクションセットを２つに分けておく
と、文脈スクリプト２及び「特定リアクションセット」
を交換することによって、リアクション音声の生成に関
連する機構を他のシステムへ適用できるようになる。

【００１７】一方、性格モード５は、「やさしい性
格」，「厳しい性格」，「のりのよい性格」，「クール
な性格」といったようなシステムの擬人的な性格を記述
したものである。この性格モード５は、図示省略した記
憶装置上に格納されており、その記述内容についてはユ
ーザが適宜変更できるようになっている。

【００１８】リアクションモード決定装置６は、予め設
定しておいた性格モード５と、後述する出力履歴保存装
置１２に保持されているリアクション音声ＲＶの出力履
歴をもとにして、「リアクションモード」を決定する。
ここで言うリアクションモードとは、インタラプト音声
や指示音声に感情表現やバリエーションを付けるための
もので、「怒った感じ」，「哀しい感じ」，「喜んだ感
じ」，「楽しい感じ」，「のりのよい感じ」，「すまし
た感じ」等といったものである。本実施形態では、こう
したリアクションモードにより、ユーザへ与える印象に
変化をつけている。

【００１９】例えば、ユーザが何度も同じ誤りを繰り返
していると次第に口調が厳しくなって「怒った感じ」の
リアクションモードになり、また、ユーザとシステムと
のやりとりが正しくスムーズに進んでいると次第に口調
がやわらかくなって「楽しい感じ」のリアクションモー
ドになる。また、例えば性格モード５が「やさしい性
格」と「厳しい性格」とでは、リアクションモードが
「怒った感じ」のモードになるまでのモード変化の仕方
を変えるようにしている。このように、人間同士の会話
でも見られるリアクションモードの切り替えを行うこと
によってユーザに与える印象を変化させ、それにより、
知的な振る舞いや人間っぽい振る舞いをシステムで表現
している。

【００２０】インタラプト音声生成装置７は、入力Ｉ
Ｎ，解釈装置３の出力（文脈スクリプトの解釈結果），
リアクションモード決定装置６の出力（リアクションモ
ード）をもとに、リアクションセット４の中から音声デ
ータを選択してインタラプト音声を生成する。ここで生
成されるインタラプト音声は、例えば、「えっ」「え
ー」「あっ」「あー」（驚いた感じや躊躇した感じ，し
ゃべりはじめの言葉等）といった間投詞，「そこ」「そ
れ」といった指示語，「そうそう」「そう」「うーん」
（納得した感じ，了解した感じ）といった了解を表す言
葉，「まって」「ちょっと」「うーん」（疑問を持った
感じ）といった言葉等の短い音声である。

【００２１】指示音声生成装置８は、指示項目の決定，
指示メッセージの生成，指示メッセージの修飾といった
処理を行ってユーザへの指示音声を生成する。指示音声
生成装置８において、まず指示項目決定部９は、入力Ｉ
Ｎおよび解釈装置３の出力をもとに、ユーザに対してど
ういった指示を出すのかを決定する。この指示として
は、お手本との位置のずれやユーザに対する次の操作の
指示などが挙げられる。

【００２２】次に、指示メッセージ生成部１０は、指示
項目決定部９の出力とリアクションモード決定装置６の
出力に基づいて、具体的な指示メッセージを生成する。
この指示メッセージは例えば、「右から左」とか「上
に」といった指示や「待って」といったシステムの状態
を表すものである。

【００２３】次いで、指示メッセージ修飾部１１は、指
示メッセージ生成部１０で生成された指示メッセージに
対し、リアクションモード決定装置６の出力に基づいて
修飾を行う。例えば、「右から」というメッセージに対
しては、「もっと右から」や「もう少し右から」といっ
たように「程度」を付加したり、出力履歴保存装置１２
内の履歴情報をもとにして「今度は右から」や「まだ右
から」といったようにする。また、「怒った感じ」や
「楽しい感じ」といった感情表現も行うようにする。そ
して、修飾されたメッセージに対応する音声データをリ
アクションセット４の中から選択して指示音声を生成す
る。

【００２４】出力履歴保存装置１２は、インタラプト音
声生成装置７の出力（インタラプト音声），指示音声生
成装置８の出力（指示音声），応答画像生成装置１３の
出力（応答画像）に関する出力履歴を保持している。応
答画像生成装置１３は、入力ＩＮと解釈装置３の出力を
もとにして応答画像を生成する。そして、上述した出力
装置１は、出力履歴保存装置１２を介して送られるイン
タラプト音声生成装置７の出力，指示音声生成装置８の
出力，応答画像生成装置１３の出力のうちの少なくとも
１つを制御してリアクション音声ＲＶを出力する。例え
ば、指示音声生成装置８からの指示音声と応答画像生成
装置１３の画像との間の同期を取るようにしたり、指示
音声生成装置８からの指示音声を待たずにインタラプト
音声生成装置７からのインタラプト音声を出力する際、
指示音声がインタラプト音声にかぶらないようにしたり
する。

【００２５】次に、図２を参照しつつ、上記構成による
音声応答装置を用いたリアクション音声の生成手順につ
いて説明する。ここで、文字ごとに指示を行うポイント
と、インタラプトメッセージを出す／出さない等の制御
情報を文脈スクプリト２に予め記述しておくようにす
る。また、性格モード５として「やさしい先生」や「厳
しい先生」といったモード（以下、特に「教師モード」
という）を予め設定しておくものとする。

【００２６】いま、ユーザのペン入力によって「書きは
じめ」の位置のずれといったイベントが発生すると、こ
のイベントが入力ＩＮとして音声応答装置に与えられる
（ステップＳ１）。これによって以下に詳述する通り、
発生したイベントに対し、文脈スクリプト２に基づい
て、異なる２本のメッセージ生成パスでインタラプトメ
ッセージ（インタラプト音声）及び指示メッセージ（指
示音声）を生成する。

【００２７】まず、インタラプト音声生成装置７は、イ
ベントの発生により与えられた入力ＩＮと解釈装置３に
より解釈された文脈スクリプト２に基づいて、リアクシ
ョンセット４から音声データを選択してインタラプト音
声を生成し、これを出力履歴保存装置１２へ出力する
（ステップＳ２）。出力履歴保存装置１２は生成された
インタラプト音声を出力履歴として保存する一方、出力
装置１は、このインタラプト音声をリアクション音声Ｒ
Ｖとして出力（ステップＳ３）する。これにより、「あ
っ」とか「そこっ」といったような間投詞や指示代名詞
を用いてユーザの注意を引き、ユーザの動作をインタラ
プトする。

【００２８】一方、指示項目決定部９は、イベントの発
生で与えられた入力ＩＮと解釈装置３で解釈された文脈
スクリプト２を比較して、ユーザに対してどういった指
示を出すべきかを決定する（ステップＳ４）。次に、指
示メッセージ生成部１０は、決定された指示に基づいて
「右から」とか「大きく撥ねて」といった具体的な指示
メッセージを生成する（ステップＳ５）。次いで、指示
メッセージ修飾部１１は、リアクションモード決定装置
６が決定（ステップＳ６）したリアクションモードに基
づいて、生成された指示メッセージに対して以下に述べ
るような修飾を行う（ステップＳ７）。

【００２９】すなわち、リアクションモード決定装置６
は、設定しておいた性格モード５（図２では教師モード
１５）と、今までに出力した出力履歴保存装置１２内の
リアクション音声の履歴をもとに、指示メッセージへ感
情表現やバリエーションを付け加える。例えば、何度も
同じ誤りを繰り返しているような場合には次第に口調を
厳しくして「怒った」印象を与える一方、うまく書ける
ようになっていれば次第に口調を柔らかくして「明るく
のりのよい」印象を与えるなどする。その際、教師モー
ド１５が「きびしい先生」と「やさしい先生」とでは、
「怒る」までの誤りの繰り返し回数の閾値を変える。こ
のようにして、システムに個性を与えてユーザへ与える
印象に変化を付けている。このように、人間同士の会話
でも見られるリアクションモードの切り替えを行うこと
によって、ユーザへ与える印象を変化させ、知的な振る
舞いや人間っぽい振る舞いを表現している。

【００３０】次に、指示メッセージ修飾部１１は、修飾
の施された指示メッセージに対応した音声データをリア
クションセット４から取り出し、これを出力履歴保存装
置１２に出力する。出力履歴保存装置１２はこの音声デ
ータを出力履歴として保存（ステップＳ８）してから出
力装置１へ送出する。こうして、出力装置１は、指示音
声生成装置８からの指示音声をリアクション音声ＲＶと
して出力する（ステップＳ３）。以上のように、本実施
形態におけるリアクション音声生成の特徴は、指示音声
による指示を行う前にインタラプトメッセージを出力す
るようにした点に加えて、教師モードとリアクション音
声の出力履歴をもとにして、感情表現やバリエーション
を付ける機構を有する点にある。

【００３１】以上詳述した通り、本実施形態によるシス
テムでは、ユーザへ応答音声を伝える前に注意音声を出
力することで、システムの応答である応答音声を確実に
ユーザに伝えることができる。また、注意音声として間
投詞や指示語といった音声を用いることにより、我々人
間同士で会話を行うときと同様に、ユーザとシステムの
間でスムーズで自然なインタラクションを行わせること
ができる。したがって、従来の技術が抱える問題点、即
ち、ユーザの注意を引くためにブザーやベルといった音
を使用しているがために、ユーザとシステムの間でスム
ーズかつ自然なインタラクションを行うのが困難である
という問題を解消できる。さらに、システムの動作が記
述されている文脈スクリプトに従って一貫性があり特徴
的で多様なリアクション音声を返しているため、一本調
子，機械的，単調といったユーザがシステムに対して持
つ印象を解消して、システムをユーザフレンドリ化する
ことが可能となる。

【００３２】

【発明の効果】以上説明したように、本発明によれば、
注意を引くための合図として、ブザーやベル等ではな
く、間投詞や指示語といったインタラプト音声を用いて
いる。また、予め設定した性格モードおよび応答音声の
出力履歴に基づいてリアクションモードを決定して指示
音声を生成している。さらに、システム動作が記述され
た文脈スクリプトに従って一貫性のある特徴を持った多
様なリアクション音声を返している。これらによって、
ユーザに対して多様かつある程度の秩序を持った応答を
行うことができるとともに、システムに対する擬人的な
印象をユーザへ強く与えることができる。また、我々人
間同士で会話を行うときと同様に、ユーザとシステムの
間でスムーズで自然なインタラクションができるように
なる。したがって、システムを使う気になる，システム
を使って楽しい，システムを使って面白い，システムに
親しみを持つ，システムを使いやすいなどとユーザに感
じさせることができ、ユーザフレンドリネスを持ったシ
ステムを提供することができる。また、特に、ＣＡＩ等
のコンピュータを使った教育システムや対話システム、
アミューズメント機器といったものに適用することで、
これらシステムのヒューマンインターフェースの効率を
向上させることができる。

【００３３】また、請求項４記載の発明によれば、リア
クションセットを汎用リアクションセットと特定リアク
ションセットから構成するようにしている。これによ
り、文脈スクリプトと特定リアクションセットを交換す
ることで、リアクション音声の生成に関連する機構を他
のシステムへ適用することができる。また、請求項５記
載の発明によれば、韻律を整合した合成音声の韻律パラ
メータでリアクションセットの音声データを表してい
る。これにより、自然で多様な韻律を持ちかつコンパク
トなリアクションセットを実現することができる。ま
た、請求項６記載の発明によれば、ユーザの動作やユー
ザによる操作に対し、ユーザの注意を引いてユーザ動作
に割り込むためのインタラプト音声を注意音声で行って
から、応答内容を伝える応答音声を指示音声によって返
すようにしている。これにより、ユーザに対して応答内
容を確実に伝達することができる。

【図面の簡単な説明】

【図１】本発明の一実施形態による音声応答装置の構
成を示すブロック図である。

【図２】同音声応答装置におけるリアクション音声の
生成手順の流れを模式的に表した説明図である。

【符号の説明】

１出力装置２文脈スクリプト３解釈装置４，４-1〜４-n リアクションセット５性格モード６リアクションモード決定装置７インタラプト音声生成装置８指示音声生成装置９指示項目決定部１０指示メッセージ生成部１１指示メッセージ修飾部１２出力履歴保存装置１３応答画像生成装置１５教師モードＩＮ入力ＲＶリアクション音声

Claims

【特許請求の範囲】

【請求項１】ユーザの動作や該ユーザによる操作を検
出する検出手段と、前記検出手段の検出結果に応じたシステム動作が記述さ
れた文脈スクリプトを解釈して解釈結果を出力する解釈
手段と、前記ユーザに応答を行った応答音声の出力履歴を保存し
てゆく履歴保存手段と、擬人的性格が記述された性格モードと前記出力履歴に基
づいて、前記応答音声に変化を与えるためのリアクショ
ンモードを決定するリアクションモード決定手段と、前記検出結果，前記解釈結果および前記リアクションモ
ードに基づいて、前記ユーザの動作に割り込むインタラ
プト音声を生成するインタラプト音声生成手段と、前記検出結果，前記解釈結果および前記リアクションモ
ードに基づいて、前記ユーザに対する指示音声を生成す
る指示音声生成手段とを具備することを特徴とする音声
応答装置。
【請求項２】前記指示音声生成手段は、前記検出結果と前記解釈結果に基づいて前記ユーザに指
示すべき指示項目を決定する指示項目決定手段と、前記指示項目と前記リアクションモードに基づいて指示
メッセージを生成する指示メッセージ生成手段と、前記リアクションモードに基づいて前記指示メッセージ
を修飾する指示メッセージ修飾手段とから成ることを特
徴とする請求項１記載の音声応答装置。
【請求項３】音声データを集めたリアクションセット
が予め記憶されているリアクションセット記憶手段をさ
らに具備し、前記インタラプト音声生成手段は、生成すべきインタラ
プト音声に対応する音声データを前記リアクションセッ
トの中から選択することで、前記インタラプト音声の生
成を行うことを特徴とする請求項１又は２記載の音声応
答装置。
【請求項４】前記リアクションセットは、汎用的な応
答音声データを集めた汎用リアクションセットと、前記
文脈スクリプトに依存する音声データを集めた特定リア
クションセットからなることを特徴とする請求項３記載
の音声応答装置。
【請求項５】前記リアクションセットを構成する音声
データは、韻律を整合した合成音声の韻律パラメータで
表されることを特徴とする請求項３又は４記載の音声応
答装置。
【請求項６】前記インタラプト音声生成手段から前記
インタラプト音声を出力させたのちに、前記指示音声生
成手段から前記指示音声を出力させる出力制御手段をさ
らに具備することを特徴とする請求項１〜５の何れかの
項記載の音声応答装置。
【請求項７】前記インタラプト音声生成手段又は前記
指示音声生成手段の少なくとも一方は、前記インタラプ
ト音声又は前記指示音声を合成音声により生成すること
を特徴とする請求項１〜６の何れかの項記載の音声応答
装置。
【請求項８】前記合成音声は、録音編集合成音声，波
形編集合成音声，規則合成音声，パラメータ合成音声の
何れかであることを特徴とする請求項７記載の音声応答
装置。
【請求項９】ＣＡＩシステムに組み込まれ、或いは、
該ＣＡＩシステムとともに用いられることを特徴とする
請求項１〜８の何れかの項記載の音声応答装置。